Help:特殊字母与符号:修订间差异

帮助页面
添加的内容 删除的内容
无编辑摘要
无编辑摘要
 

(未显示3个用户的7个中间版本)

第7行: 第7行:


== 字符编码系统 ==
== 字符编码系统 ==
到2005年6月,当这个新版本的MediaWiki开始在Wikimedia上使用时,英语、荷兰语、丹麦语和瑞典语的维-{}-基百科已经使用了[[ISO 8859-1|windows-1252]]编码(他们宣布他们使用的是[[ISO-8859-1]]编码,但实际上浏览器把二者识别为同一种,而且MediaWiki并没有限制使用windows-1252的历史)。在数据库中准备升级的wiki文档将始终以windows-1252编码保存,并且在载入时被转换。此后编辑们的更新将作为UTF-8编码储存在数据库内。载入时转换的过程对于用户来说不可见
到2005年6月,当这个新版本的MediaWiki开始在Wikimedia上使用时,英语、荷兰语、丹麦语和瑞典语的维-{}-基百科已经使用了[[ISO 8859-1|windows-1252]]编码(他们宣布他们使用的是[[ISO-8859-1]]编码,但实际上浏览器把二者识别为同一种,而且MediaWiki并没有限制使用windows-1252的历史)。在数据库中准备升级的wiki文档将始终以windows-1252编码保存,并且在载入时被转换。此后编辑们的更新将作为UTF-8编码储存在数据库内。载入时转换的过程对于用户来说不可见。


* Unicode(UTF-8)
* Unicode(UTF-8)
第17行: 第17行:
** 包含最常见的特殊字符,比如é,也可表示为é,但这样没必要。
** 包含最常见的特殊字符,比如é,也可表示为é,但这样没必要。


注意Special:Export输出时使用UTF-8,无论数据库使用的是哪种编码。
注意Special:Export输出时使用UTF-8,无论数据库使用哪种编码。


若想了解某网站使用的编码系统,打开浏览器的“看源代码”,找到类似字符:
若想了解某网站使用的编码系统,打开浏览器的“网页源代码”,找到类似字符:


<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />
<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />
第32行: 第32行:
* 使用编辑框下的特殊字符以插入文章。但有可能部分字符无法显示。
* 使用编辑框下的特殊字符以插入文章。但有可能部分字符无法显示。
* 按住ALT键并从数字键区依次输入三位数输入[[EASCII]]字符,但超出EASCII范围的数字会被转换成SOH符号(U+0001)。
* 按住ALT键并从数字键区依次输入三位数输入[[EASCII]]字符,但超出EASCII范围的数字会被转换成SOH符号(U+0001)。
* 直接使用[[鍵盤配置|特种键盘]]、[[输入法]],或者字符映射程序。采用ISO-8859-1字符集的共笔站点将把字符集以外的字符转换为HTML数字字符实体(见下)。
* 直接使用[[键盘布局|特种键盘]]、[[输入法]],或者字符映射程序。采用ISO-8859-1字符集的共笔站点将把字符集以外的字符转换为HTML数字字符实体(见下)。
* 使用[[Help:HTML|HTML]]命名字符实体引用,比如<code>&amp;agrave;</code>。这对于不同的字符集来说都能非常正确的表达指定字符,即使无法显示。不过可能引起搜索的困难(见下)。
* 使用[[Help:HTML|HTML]]命名字符实体引用,比如<code>&amp;agrave;</code>。这对于不同的字符集来说都能非常正确的表达指定字符,即使无法显示。不过可能引起搜索的困难(见下)。
* 使用HTML数字字符引用,比如<code>&amp;#161;</code>。这是输入未命名实体Unicode值的唯一办法,比如土耳其字符。代码点128到159在[[ISO-8859-1]]和[[Unicode]]中都未使用,因此其间的字符引用是错误的,“非法的”,会引起多种问题。
* 使用HTML数字字符引用,比如<code>&amp;#161;</code>。这是输入未命名实体Unicode值的唯一办法,比如土耳其字符。代码点128到159在[[ISO-8859-1]]和[[Unicode]]中都未使用,因此其间的字符引用是错误的,“非法的”,会引起多种问题。
第44行: 第44行:


==== Internet Explorer ====
==== Internet Explorer ====
这种常见浏览器使用Mac OS Roman编码系统。它几乎把所有的Unicode字符变成问号,部分ISO-8859-1也不能幸免于难(特别是¤ ¦ ¹ ² ³ ¼ ½ ¾ Ð × Ý Þ ð ý þ 和软连字符,包括所有[[Extended ASCII]]中編號161到255的字元)。所以用它浏览求闻百科会造成极大的不便。
这种常见浏览器使用Mac OS Roman编码系统。它几乎把所有的Unicode字符变成问号,部分ISO-8859-1也不能幸免于难(特别是¤ ¦ ¹ ² ³ ¼ ½ ¾ Ð × Ý Þ ð ý þ 和软连字符,包括所有[[EASCII|Extended ASCII]]中編號161到255的字元)。所以用它浏览求闻百科会造成极大的不便。


==== Netscape 4 ====
==== Netscape 4 ====
第77行: 第77行:
| {{T1|Special characters}} || 提示读者该页面中含有特殊字母或符号 || {{Special characters}}
| {{T1|Special characters}} || 提示读者该页面中含有特殊字母或符号 || {{Special characters}}
|----
|----
| {{T1|Non-printing character}} || 提示读者该页面中含有[[控制字|非显示控制字符]] || {{Non-printing character}}
| {{T1|Non-printing character}} || 提示读者该页面中含有[[控制字|非显示控制字符]]|| {{Non-printing character}}
|----
|----
| {{T1|Burmese characters}} || 提示读者该页面中含有[[缅文|缅文字母]] || {{Burmese characters}}
| {{T1|Burmese characters}} || 提示读者该页面中含有[[缅文|缅文字母]] || {{Burmese characters}}
第84行: 第84行:
|----
|----
| {{T1|谚文组字}} || 提示读者该页面中含有[[古谚文]],需要谚文组字 || {{谚文组字}}
| {{T1|谚文组字}} || 提示读者该页面中含有[[古谚文]],需要谚文组字 || {{谚文组字}}
|----
|}
|}


第158行: 第157行:


;Linux
;Linux
基于[[Debian]]的[[Linux]](例如ubuntu和Linux Mint等)可通过[[Synaptic]]下载<code>ttf-ancient-fonts</code>的[[deb|deb包]]。
基于[[Debian]]的[[Linux]](例如ubuntu和Linux Mint等)可通过[[新立得|Synaptic]]下载<code>ttf-ancient-fonts</code>的[[deb|deb包]]。


=== 撒马利亚字母 ===
=== 撒马利亚字母 ===
第199行: 第198行:
要显示[[婆罗米系文字]],从下列的链接下载安装字体:
要显示[[婆罗米系文字]],从下列的链接下载安装字体:


==== [[藏文]] ====
* [[高棉文]]:[http://www.wazu.jp/gallery/Fonts_Khmer.html Khmer Unicode Fonts]
[https://github.com/notofonts/tibetan Noto Serif Tibetan]
* [[天城文]]:[http://www.wazu.jp/gallery/Fonts_Devanagari.html Devanagari Unicode Fonts]

* [[孟加拉文]]:[http://www.wazu.jp/gallery/Fonts_Bengali.html Bengali Unicode Fonts]
[http://www.yalasoo.com/files/bigger_himalaya.ttf 放大化的微软默认藏文字体]
* [[古吉拉特文]]:[http://www.wazu.jp/gallery/Fonts_Gujarati.html Gujarati Unicode Fonts]

* [[古木基文]]:[http://www.wazu.jp/gallery/Fonts_Gurmukhi.html Gurmukhi Unicode Fonts]
* [[缅文]]:[http://www.wazu.jp/gallery/Fonts_Myanmar.html Myanmar Unicode Fonts]
[http://www.wazu.jp/gallery/Fonts_Tibetan.html Tibetan Unicode Fonts]

* [[奥里亚文]]:[http://www.wazu.jp/gallery/Fonts_Oriya.html Oriya Unicode Fonts]
==== [[高棉文]] ====
* [[泰卢固文]]:[http://www.wazu.jp/gallery/Fonts_Telugu.html Telugu Unicode Fonts]
* [[卡纳达文]]:[http://www.wazu.jp/gallery/Fonts_Kannada.html Kannada Unicode Fonts]
[http://www.wazu.jp/gallery/Fonts_Khmer.html Khmer Unicode Fonts]

* [[僧伽罗文]]:[http://www.wazu.jp/gallery/Fonts_Sinhala.html Sinhala Unicode Fonts]
==== [[天城文]] ====
* [[马拉雅拉姆文]]:[http://www.wazu.jp/gallery/Fonts_Malayalam.html Malayalam Unicode Fonts]
* [[泰米尔文]]:[http://www.wazu.jp/gallery/Fonts_Tamil.html Tamil Unicode Fonts]
[http://www.wazu.jp/gallery/Fonts_Devanagari.html Devanagari Unicode Fonts]

* [[泰文]]:[http://www.wazu.jp/gallery/Fonts_Thai.html Thai Unicode Fonts]、[[泰国国家字体]]、[https://www.google.com/get/noto/#sans-thai Noto Sans Thai]
==== [[孟加拉文]] ====
* -{zh-cn:[[老挝文]]; zh-hk:[[老撾文]]; zh-tw:[[寮文]]; zh-sg:[[寮文]];}-:[http://www.wazu.jp/gallery/Fonts_Lao.html Lao Unicode Fonts]
* [[:布吉文|布吉文]]:[http://www.wazu.jp/gallery/Fonts_Buginese.html Buginese Unicode Fonts]、[http://www.google.com/get/noto/ Noto Sans Buginese]
[http://www.wazu.jp/gallery/Fonts_Bengali.html Bengali Unicode Fonts]

* [[藏文]]:[http://www.wazu.jp/gallery/Fonts_Tibetan.html Tibetan Unicode Fonts]
==== [[古吉拉特文]] ====
* [[悉昙文]]:[http://mihafont.seesaa.net/article/167209339.html Muktamsiddham]、[https://github.com/googlefonts/noto-fonts Noto Sans Siddham]、[http://siddham.shikisokuzekuu.net/ ApSiddham](需要 [[Graphite]] 技术支持)
[http://www.wazu.jp/gallery/Fonts_Gujarati.html Gujarati Unicode Fonts]

==== [[古木基文]] ====
[http://www.wazu.jp/gallery/Fonts_Gurmukhi.html Gurmukhi Unicode Fonts]

==== [[缅文]] ====
[http://www.wazu.jp/gallery/Fonts_Myanmar.html Myanmar Unicode Fonts]

==== [[奥里亚文]] ====
[http://www.wazu.jp/gallery/Fonts_Oriya.html Oriya Unicode Fonts]

==== [[泰卢固文]] ====
[http://www.wazu.jp/gallery/Fonts_Telugu.html Telugu Unicode Fonts]

==== [[卡纳达文]] ====
[http://www.wazu.jp/gallery/Fonts_Kannada.html Kannada Unicode Fonts]

==== [[僧伽罗文]] ====
[http://www.wazu.jp/gallery/Fonts_Sinhala.html Sinhala Unicode Fonts]

==== [[马拉雅拉姆文]] ====
[http://www.wazu.jp/gallery/Fonts_Malayalam.html Malayalam Unicode Fonts]

==== [[泰米尔文]] ====
[http://www.wazu.jp/gallery/Fonts_Tamil.html Tamil Unicode Fonts]

==== [[泰文]] ====
[http://www.wazu.jp/gallery/Fonts_Thai.html Thai Unicode Fonts]

[[泰国国家字体]]

[https://www.google.com/get/noto/#sans-thai Noto Sans Thai]
==== -{zh-cn:[[老挝文]]; zh-hk:[[老撾文]]; zh-tw:[[寮文]]; zh-sg:[[寮文]];}- ====
[http://www.wazu.jp/gallery/Fonts_Lao.html Lao Unicode Fonts]

==== [[:布吉文|布吉文]]====
[http://www.wazu.jp/gallery/Fonts_Buginese.html Buginese Unicode Fonts]

[http://www.google.com/get/noto/ Noto Sans Buginese]

==== [[悉昙文]] ====
[http://mihafont.seesaa.net/article/167209339.html Muktamsiddham]

[https://github.com/googlefonts/noto-fonts Noto Sans Siddham]

[http://siddham.shikisokuzekuu.net/ ApSiddham](需要 [[Graphite]] 技术支持)


=== 蒙古文、满文、锡伯文 ===
=== 蒙古文、满文、锡伯文 ===
要显示[[蒙古文]]、[[满文]]、[[锡伯文]],从下列的链接下载安装字体:
要显示使用[[蒙古字母]]书写的[[蒙古文]]、[[满文]]、[[锡伯文]]等文种,从下列的链接下载安装字体:
* [http://cheonhyeong.com/Simplified/download.html 天珩字库-TH-Tshyn 7z压缩包/exe安装包中的TH-Times.ttc]
* [http://cheonhyeong.com/Simplified/download.html 天珩字库-TH-Tshyn 7z压缩包/exe安装包中的TH-Times.ttc]
* [http://www.google.com/get/noto/ Noto Sans Mongolian]
* [http://www.google.com/get/noto/ Noto Sans Mongolian]
第268行: 第313行:
== 参见 ==
== 参见 ==
* [[基本多文种平面]]
* [[基本多文种平面]]
* [[Help:编辑]]
* [[Help:编辑页面]]
* [[Help:数学公式]]
* [[Help:数学公式]]
* [[Help:Unicode扩展汉字]]
* [[Help:Unicode扩展汉字]]