Help:特殊字母与符号:修订间差异

帮助页面
添加的内容 删除的内容
无编辑摘要
无编辑摘要
 

(未显示4个用户的13个中间版本)

第7行: 第7行:


== 字符编码系统 ==
== 字符编码系统 ==
[[2005年]][[6月]]底,当这个新版本开始在维基媒体上使用时,英、荷兰、丹麦和瑞典的求闻百科已经使用了[[ISO 8859-1|windows-1252]]编码(他们宣布他们使用的是[[ISO-8859-1]]编码,但实际上浏览器把二者识别为同一种,而且Mediawiki并没有限制使用windows-1252的历史)。在数据库中准备升级的wiki文档将始终以windows-1252编码保存,并且在载入时被转换。此后编辑们的更新将作为UTF-8编码储存在数据库内。载入时转换的过程对于用户来说不可见
到2005年6月,当这个新版本的MediaWiki开始在Wikimedia上使用时,英、荷兰、丹麦和瑞典维-{}-基百科已经使用了[[ISO 8859-1|windows-1252]]编码(他们宣布他们使用的是[[ISO-8859-1]]编码,但实际上浏览器把二者识别为同一种,而且MediaWiki并没有限制使用windows-1252的历史)。在数据库中准备升级的wiki文档将始终以windows-1252编码保存,并且在载入时被转换。此后编辑们的更新将作为UTF-8编码储存在数据库内。载入时转换的过程对于用户来说不可见。


* Unicode(UTF-8)
* Unicode(UTF-8)
第17行: 第17行:
** 包含最常见的特殊字符,比如é,也可表示为é,但这样没必要。
** 包含最常见的特殊字符,比如é,也可表示为é,但这样没必要。


注意Special:Export输出时使用UTF-8,无论数据库使用的是哪种编码。
注意Special:Export输出时使用UTF-8,无论数据库使用哪种编码。


若想了解某维基使用的编码系统,打开浏览器的“看源代码”,找到类似字符:
若想了解某网站使用的编码系统,打开浏览器的“网页源代码”,找到类似字符:


<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />
<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />
第25行: 第25行:


<meta http-equiv="Content-type" content="text/html; charset=utf-8" />
<meta charset="utf-8" />


== 编辑 ==
== 编辑 ==
许多不在标准[[ASCII]]表中的字符也许对共笔站点十分重要。有四种方法输入非ASCII字符:
{{Main|Help:編輯特殊字母與符號}}
许多不在标准[[ASCII]]表中的字符也许对维基十分重要。有四种方法输入非ASCII字符:


* 使用编辑框下的特殊字符以插入文章。但有可能部分字符无法显示。
* 使用编辑框下的特殊字符以插入文章。但有可能部分字符无法显示。
* 按住ALT键并从数字键区依次输入三位数输入[[EASCII]]字符,但超出EASCII范围的数字会被转换成SOH符号(U+0001)。
* 按住ALT键并从数字键区依次输入三位数输入[[EASCII]]字符,但超出EASCII范围的数字会被转换成SOH符号(U+0001)。
* 直接使用[[鍵盤配置|特种键盘]]、[[输入法]],或者字符映射程序。ISO-8859-1的维基将把字符集以外的字符转换为HTML数字字符实体(见下)。
* 直接使用[[键盘布局|特种键盘]]、[[输入法]],或者字符映射程序。采用ISO-8859-1字符集共笔站点将把字符集以外的字符转换为HTML数字字符实体(见下)。
* 使用[[Help:HTML|HTML]]命名字符实体引用,比如<code>&amp;agrave;</code>。这对于不同的字符集来说都能非常正确的表达指定字符,即使无法显示。不过可能引起搜索的困难(见下)。
* 使用[[Help:HTML|HTML]]命名字符实体引用,比如<code>&amp;agrave;</code>。这对于不同的字符集来说都能非常正确的表达指定字符,即使无法显示。不过可能引起搜索的困难(见下)。
* 使用HTML数字字符引用,比如<code>&amp;#161;</code>。这是输入未命名实体Unicode值的唯一办法,比如土耳其字符。代码点128到159在[[ISO-8859-1]]和[[Unicode]]中都未使用,因此其间的字符引用是错误的,“非法的”,会引起多种问题。
* 使用HTML数字字符引用,比如<code>&amp;#161;</code>。这是输入未命名实体Unicode值的唯一办法,比如土耳其字符。代码点128到159在[[ISO-8859-1]]和[[Unicode]]中都未使用,因此其间的字符引用是错误的,“非法的”,会引起多种问题。
第45行: 第44行:


==== Internet Explorer ====
==== Internet Explorer ====
这种常见浏览器使用Mac OS Roman编码系统。它几乎把所有的Unicode字符变成问号,部分ISO-8859-1也不能幸免于难(特别是¤ ¦ ¹ ² ³ ¼ ½ ¾ Ð × Ý Þ ð ý þ 和软连字符,包括所有[[Extended ASCII]]中編號161到255的字元)。所以用它浏览求闻百科会造成极大的不便。
这种常见浏览器使用Mac OS Roman编码系统。它几乎把所有的Unicode字符变成问号,部分ISO-8859-1也不能幸免于难(特别是¤ ¦ ¹ ² ³ ¼ ½ ¾ Ð × Ý Þ ð ý þ 和软连字符,包括所有[[EASCII|Extended ASCII]]中編號161到255的字元)。所以用它浏览求闻百科会造成极大的不便。


==== Netscape 4 ====
==== Netscape 4 ====
第62行: 第61行:
|}
|}


在英文维基变为UTF-8之后,跨维基机器人就开始替换HTML实体为Unicode字符,但对于有些浏览器来说,不正常的Unicode字符越来越多。工作区就是为此设计,以保证那些浏览器能安全的进行编辑,当然仅当Mediawiki知道哪些浏览器是有问题的。
对于极少数浏览器来说,不正常的Unicode字符越来越多。工作区就是为此设计,以保证那些浏览器能安全的进行编辑,当然仅当Mediawiki知道哪些浏览器是有问题的。


列在$wgBrowserBlackList(一组正则表达式,匹配User-Agent字符串)的浏览器被提供一个特别的编辑框。十六进制HTML实体有多余的前导0,非ASCII字符在编辑框显示为无前导0的十六进制HTML实体。
列在$wgBrowserBlackList(一组正则表达式,匹配User-Agent字符串)的浏览器被提供一个特别的编辑框。十六进制HTML实体有多余的前导0,非ASCII字符在编辑框显示为无前导0的十六进制HTML实体。
第78行: 第77行:
| {{T1|Special characters}} || 提示读者该页面中含有特殊字母或符号 || {{Special characters}}
| {{T1|Special characters}} || 提示读者该页面中含有特殊字母或符号 || {{Special characters}}
|----
|----
| {{T1|Non-printing character}} || 提示读者该页面中含有[[控制字|非打印]] || {{Non-printing character}}
| {{T1|Non-printing character}} || 提示读者该页面中含有[[控制字|非显示控制]]|| {{Non-printing character}}
|----
|----
| {{T1|Burmese characters}} || 提示读者该页面中含有[[缅文|缅文字母]] || {{Burmese characters}}
| {{T1|Burmese characters}} || 提示读者该页面中含有[[缅文|缅文字母]] || {{Burmese characters}}
第85行: 第84行:
|----
|----
| {{T1|谚文组字}} || 提示读者该页面中含有[[古谚文]],需要谚文组字 || {{谚文组字}}
| {{T1|谚文组字}} || 提示读者该页面中含有[[古谚文]],需要谚文组字 || {{谚文组字}}
|----
|}
|}


== 查看 ==
== 查看 ==
目前大多数网页浏览器都配备一定程度的Unicode编码字支持,最常遇到的问题是,在Microsoft Windows XP上运行的网页浏览器依赖于注册表中的预配置字体链接,而不是实际搜索可检视相关字符的字体。这意味着网页浏览器通常不得不被迫检视特定的字体。在求闻百科上有一套模板可以做到这一点,例如国际音标的{{tlx|IPA}}。Windows Glyph List 4中的内容在没有这些特殊措施的情况下应该可以安全使用。
目前大多数网页浏览器都配备一定程度的Unicode编码字支持,最常遇到的问题是,在Microsoft Windows XP上运行的网页浏览器依赖于注册表中的预配置字体链接,而不是实际搜索可检视相关字符的字体。这意味着网页浏览器通常不得不被迫检视特定的字体。在求闻百科上有一套模板可以做到这一点,例如国际音标的{{tlx|IPA}}。Windows Glyph List 4中的内容在没有这些特殊措施的情况下应该可以安全使用。


;显示特殊字符
;显示特殊字符
第98行: 第96行:
使用Konqueror、Opera、Safari和其他基于Chromium开源项目的大多数浏览器时,特殊符号应该可以正确显示,而不必进一步配置。在遵循先前提到的步骤之后,为了更好(和正确)显示具有连字形式的字符,组合字符的可选步骤是安装渲染引擎软件。
使用Konqueror、Opera、Safari和其他基于Chromium开源项目的大多数浏览器时,特殊符号应该可以正确显示,而不必进一步配置。在遵循先前提到的步骤之后,为了更好(和正确)显示具有连字形式的字符,组合字符的可选步骤是安装渲染引擎软件。


要使用一种可用的Unicode字体在表格或图表或框中显示特殊字符,请指定<code>class="Unicode"</code>在表的TR行标记中(或者每个TD标记中,但每个TR中使用它比在每个TD中使用它更容易),于维基表代码使用时则在(TR等值)之后使用<code>|-</code>(例如<code>|- class ="Unicode"</code>)。
要使用一种可用的Unicode字体在表格或图表或框中显示特殊字符,请指定<code>class="Unicode"</code>在表的TR行标记中(或者每个TD标记中,但每个TR中使用它比在每个TD中使用它更容易),于wikitext表代码使用时则在(TR等值)之后使用<code>|-</code>(例如<code>|- class ="Unicode"</code>)。


为了显示单个特殊字符,可以在char的位置使用HTML十进制或十六进制数字实体代码。如果需要显示具有许多特殊Unicode字符的段落,可以使用<code>&lt;p class="Unicode"></code>……<code>&lt;/p&gt;</code>或<code>&lt;span class="Unicode"&gt;</code>……<code>&lt;/span&gt;</code>。
为了显示单个特殊字符,可以在char的位置使用HTML十进制或十六进制数字实体代码。如果需要显示具有许多特殊Unicode字符的段落,可以使用<code>&lt;p class="Unicode"></code>……<code>&lt;/p&gt;</code>或<code>&lt;span class="Unicode"&gt;</code>……<code>&lt;/span&gt;</code>。


<code>class="Unicode"</code>用于网页和页面、HTML或维基标签,其中各种各样的Unicode编码字元的各种字符需要被显示。如果需要在网页上显示的特殊字符大部分覆盖较少的与拉丁脚本有关的Unicode编码字元,可以使用<code>class="latinx"</code>。对于与国际音标有关的特殊字符或符号,可以使用<code>class="IPA"</code>。对于polytonic (Greek)字符或相关符号,可以使用<code>class="polytonic"</code>。
<code>class="Unicode"</code>用于网页和页面、HTML或wikitext标签,其中各种各样的Unicode编码字元的各种字符需要被显示。如果需要在网页上显示的特殊字符大部分覆盖较少的与拉丁脚本有关的Unicode编码字元,可以使用<code>class="latinx"</code>。对于与国际音标有关的特殊字符或符号,可以使用<code>class="IPA"</code>。对于polytonic (Greek)字符或相关符号,可以使用<code>class="polytonic"</code>。


;更改默认字体
;更改默认字体
Google Chrome允许用户为普通,衬线,无衬线和等宽显示模式设置默认字体。使用当前在系统上安装的任何字体。若要访问此设置,请点击设置,並选择显示高级设置,然后进入自定义字体。您可以在这里可以选择系统中的任何字体作为默认值。
Google Chrome允许用户为普通,衬线,无衬线和等宽显示模式设置默认字体。使用当前在系统上安装的任何字体。若要访问此设置,请点击设置,並选择显示高级设置,然后进入自定义字体。您可以在这里可以选择系统中的任何字体作为默认值。


注意:根据页面元素,许多网站(包括维基媒体)默认为serif或sans-serif字体(例如标题可能默认为serif,正文文本为sans serif),因此如果您希望覆盖并强制这个某种字体,需要使用自定义CSS样式。
注意:根据页面元素,许多网站默认为serif或sans-serif字体(例如标题可能默认为serif,正文文本为sans serif),因此如果您希望覆盖并强制这个某种字体,需要使用自定义CSS样式。


用于Microsoft Windows的旧版Internet Explorer中的拉丁脚本的默认字体是Times New Roman。较早版本的字体不包含许多Unicode编码字元。要在Internet Explorer中正确查看特殊字符,必须将字型更改,例如免费提供的TITUS Cyber​​bit Basic和GNU Unifont。
用于Microsoft Windows的旧版Internet Explorer中的拉丁脚本的默认字体是Times New Roman。较早版本的字体不包含许多Unicode编码字元。要在Internet Explorer中正确查看特殊字符,必须将字型更改,例如免费提供的TITUS Cyber​​bit Basic和GNU Unifont。
第159行: 第157行:


;Linux
;Linux
基于[[Debian]]的[[Linux]](例如ubuntu和Linux Mint等)可通过[[Synaptic]]下载<code>ttf-ancient-fonts</code>的[[deb|deb包]]。
基于[[Debian]]的[[Linux]](例如ubuntu和Linux Mint等)可通过[[新立得|Synaptic]]下载<code>ttf-ancient-fonts</code>的[[deb|deb包]]。


=== 撒马利亚字母 ===
=== 撒马利亚字母 ===
第200行: 第198行:
要显示[[婆罗米系文字]],从下列的链接下载安装字体:
要显示[[婆罗米系文字]],从下列的链接下载安装字体:


==== [[藏文]] ====
* [[高棉文]]:[http://www.wazu.jp/gallery/Fonts_Khmer.html Khmer Unicode Fonts]
[https://github.com/notofonts/tibetan Noto Serif Tibetan]
* [[天城文]]:[http://www.wazu.jp/gallery/Fonts_Devanagari.html Devanagari Unicode Fonts]

* [[孟加拉文]]:[http://www.wazu.jp/gallery/Fonts_Bengali.html Bengali Unicode Fonts]
[http://www.yalasoo.com/files/bigger_himalaya.ttf 放大化的微软默认藏文字体]
* [[古吉拉特文]]:[http://www.wazu.jp/gallery/Fonts_Gujarati.html Gujarati Unicode Fonts]

* [[古木基文]]:[http://www.wazu.jp/gallery/Fonts_Gurmukhi.html Gurmukhi Unicode Fonts]
* [[缅文]]:[http://www.wazu.jp/gallery/Fonts_Myanmar.html Myanmar Unicode Fonts]
[http://www.wazu.jp/gallery/Fonts_Tibetan.html Tibetan Unicode Fonts]

* [[奥里亚文]]:[http://www.wazu.jp/gallery/Fonts_Oriya.html Oriya Unicode Fonts]
==== [[高棉文]] ====
* [[泰卢固文]]:[http://www.wazu.jp/gallery/Fonts_Telugu.html Telugu Unicode Fonts]
* [[卡纳达文]]:[http://www.wazu.jp/gallery/Fonts_Kannada.html Kannada Unicode Fonts]
[http://www.wazu.jp/gallery/Fonts_Khmer.html Khmer Unicode Fonts]

* [[僧伽罗文]]:[http://www.wazu.jp/gallery/Fonts_Sinhala.html Sinhala Unicode Fonts]
==== [[天城文]] ====
* [[马拉雅拉姆文]]:[http://www.wazu.jp/gallery/Fonts_Malayalam.html Malayalam Unicode Fonts]
* [[泰米尔文]]:[http://www.wazu.jp/gallery/Fonts_Tamil.html Tamil Unicode Fonts]
[http://www.wazu.jp/gallery/Fonts_Devanagari.html Devanagari Unicode Fonts]

* [[泰文]]:[http://www.wazu.jp/gallery/Fonts_Thai.html Thai Unicode Fonts]、[[泰国国家字体]]、[https://www.google.com/get/noto/#sans-thai Noto Sans Thai]
==== [[孟加拉文]] ====
* -{zh-cn:[[老挝文]]; zh-hk:[[老撾文]]; zh-tw:[[寮文]]; zh-sg:[[寮文]];}-:[http://www.wazu.jp/gallery/Fonts_Lao.html Lao Unicode Fonts]
* [[:布吉文|布吉文]]:[http://www.wazu.jp/gallery/Fonts_Buginese.html Buginese Unicode Fonts]、[http://www.google.com/get/noto/ Noto Sans Buginese]
[http://www.wazu.jp/gallery/Fonts_Bengali.html Bengali Unicode Fonts]

* [[藏文]]:[http://www.wazu.jp/gallery/Fonts_Tibetan.html Tibetan Unicode Fonts]
==== [[古吉拉特文]] ====
* [[悉昙文]]:[http://mihafont.seesaa.net/article/167209339.html Muktamsiddham]、[https://github.com/googlefonts/noto-fonts Noto Sans Siddham]、[http://siddham.shikisokuzekuu.net/ ApSiddham](需要 [[Graphite]] 技术支持)
[http://www.wazu.jp/gallery/Fonts_Gujarati.html Gujarati Unicode Fonts]

==== [[古木基文]] ====
[http://www.wazu.jp/gallery/Fonts_Gurmukhi.html Gurmukhi Unicode Fonts]

==== [[缅文]] ====
[http://www.wazu.jp/gallery/Fonts_Myanmar.html Myanmar Unicode Fonts]

==== [[奥里亚文]] ====
[http://www.wazu.jp/gallery/Fonts_Oriya.html Oriya Unicode Fonts]

==== [[泰卢固文]] ====
[http://www.wazu.jp/gallery/Fonts_Telugu.html Telugu Unicode Fonts]

==== [[卡纳达文]] ====
[http://www.wazu.jp/gallery/Fonts_Kannada.html Kannada Unicode Fonts]

==== [[僧伽罗文]] ====
[http://www.wazu.jp/gallery/Fonts_Sinhala.html Sinhala Unicode Fonts]

==== [[马拉雅拉姆文]] ====
[http://www.wazu.jp/gallery/Fonts_Malayalam.html Malayalam Unicode Fonts]

==== [[泰米尔文]] ====
[http://www.wazu.jp/gallery/Fonts_Tamil.html Tamil Unicode Fonts]

==== [[泰文]] ====
[http://www.wazu.jp/gallery/Fonts_Thai.html Thai Unicode Fonts]

[[泰国国家字体]]

[https://www.google.com/get/noto/#sans-thai Noto Sans Thai]
==== -{zh-cn:[[老挝文]]; zh-hk:[[老撾文]]; zh-tw:[[寮文]]; zh-sg:[[寮文]];}- ====
[http://www.wazu.jp/gallery/Fonts_Lao.html Lao Unicode Fonts]

==== [[:布吉文|布吉文]]====
[http://www.wazu.jp/gallery/Fonts_Buginese.html Buginese Unicode Fonts]

[http://www.google.com/get/noto/ Noto Sans Buginese]

==== [[悉昙文]] ====
[http://mihafont.seesaa.net/article/167209339.html Muktamsiddham]

[https://github.com/googlefonts/noto-fonts Noto Sans Siddham]

[http://siddham.shikisokuzekuu.net/ ApSiddham](需要 [[Graphite]] 技术支持)


=== 蒙古文、满文、锡伯文 ===
=== 蒙古文、满文、锡伯文 ===
要显示[[蒙古文]]、[[满文]]、[[锡伯文]],从下列的链接下载安装字体:
要显示使用[[蒙古字母]]书写的[[蒙古文]]、[[满文]]、[[锡伯文]]等文种,从下列的链接下载安装字体:
* [http://cheonhyeong.com/Simplified/download.html 天珩字库-TH-Tshyn 7z压缩包/exe安装包中的TH-Times.ttc]
* [http://www.google.com/get/noto/ Noto Sans Mongolian]
* [http://www.google.com/get/noto/ Noto Sans Mongolian]
* [http://abkai.net/core/zh/manchu/manchu-fonts/ 太清 - 满文、锡伯文、达呼尔文字体]
* [http://abkai.net/core/zh/manchu/manchu-fonts/ 太清 - 满文、锡伯文、达呼尔文字体]
第231行: 第276行:
要显示[[八思巴字]],从下列的链接下载安装字体:
要显示[[八思巴字]],从下列的链接下载安装字体:
* [http://www.babelstone.co.uk/Fonts/Phags-pa.html BabelStone Phags-pa Fonts]
* [http://www.babelstone.co.uk/Fonts/Phags-pa.html BabelStone Phags-pa Fonts]
* [http://cheonhyeong.com/Simplified/download.html 天珩字库-TH-Tshyn 7z压缩包/exe安装包中的TH-Times.ttc]


=== 西夏文 ===
=== 西夏文 ===
第237行: 第283行:
* [http://www.babelstone.co.uk/Fonts/Yinchuan.html Tangut Yinchuan]
* [http://www.babelstone.co.uk/Fonts/Yinchuan.html Tangut Yinchuan]
* [http://ccamc.co/fonts.php#n4694 字體和输入法 | 古今文字集成]
* [http://ccamc.co/fonts.php#n4694 字體和输入法 | 古今文字集成]
* [https://www.babelstone.co.uk/Fonts/Wenhai.html 史金波《文海研究》西夏文字体 载BabelStone]
* [https://www.babelstone.co.uk/Fonts/Yinchuan.html 银川北方民族大学景永时西夏文字体 载BabelStone]


=== 象雄文 ===
=== 象雄文 ===
第265行: 第313行:
== 参见 ==
== 参见 ==
* [[基本多文种平面]]
* [[基本多文种平面]]
* [[Help:编辑]]
* [[Help:编辑页面]]
* [[Help:数学公式]]
* [[Help:数学公式]]
* [[Help:Unicode扩展汉字]]
* [[Help:Unicode扩展汉字]]


== 外部链接 ==
== 外部链接 ==
* http://www.unicode.org/charts/ Unicode字符表,仅十六进制数,PDF文件显示所有浏览器不能显示的字符(英文)。
* [http://www.unicode.org/charts/ Unicode字符表],仅十六进制数,PDF文件显示所有浏览器不能显示的字符(英文)。
* http://www.unicode.org/help/display_problems.html 在大多数平台上启用Unicode的帮助(英文)。
* [http://www.unicode.org/help/display_problems.html 在大多数平台上启用Unicode的帮助](英文)。
* [http://unicode.coeurlumiere.com/ 0到65535Unicode字符],十进制。
* [http://unicode.coeurlumiere.com/ 0到65535Unicode字符],十进制。
* [http://www.alanwood.net/demos/ent4_frame.html HTML 4.0 Character Entity References]—shows how the named and decimal character references look in one's browser
* [http://www.alanwood.net/demos/ent4_frame.html HTML 4.0 Character Entity References]—shows how the named and decimal character references look in one's browser
第278行: 第326行:
* [http://www.tacowidgets.com/widgets/ CharacterPal]—Free Mac OS X Dashboard Widget that displays key combinations for special characters
* [http://www.tacowidgets.com/widgets/ CharacterPal]—Free Mac OS X Dashboard Widget that displays key combinations for special characters
* A [http://people.w3.org/rishida/scripts/uniview/conversion converter] that helps one find the right escape sequence to use—helps when one needs to escape ASCII/Unicode characters that are special characters in wiki markup
* A [http://people.w3.org/rishida/scripts/uniview/conversion converter] that helps one find the right escape sequence to use—helps when one needs to escape ASCII/Unicode characters that are special characters in wiki markup
{{-}}

{{帮助页面}}
{{帮助页面}}

[[Category:求闻百科文字幫助文檔|TSZF]]