Web

HTML文書の文字エンコーディングに UTF-8 を使うことが公式に明文化されました

投稿日:2017年10月10日 更新日:

HTML文書は文字エンコーディングUTF-8でなければなりません – 水底の血 という記事で知ったのですが、「HTML文書の文字エンコーディングは UTF-8 でなければならない」という意味の文言が HTMLの仕様書である HTML Living Standard に追記されたそうです。 現時点で、HTML文書が UTF-8 以外で記述される例を探すほうが難しい状況にはなっていましたが、これが明示的に仕様書に盛り込まれたわけです。

HTML の仕様書である HTML Living Standard には、現時点で以下のように記述されています。

Regardless of whether a character encoding declaration is present or not, the actual character encoding used to encode the document must be UTF-8.

引用元:4.2.5.5 Specifying the document’s character encoding – HTML Standard

日本語訳はこちらです。

文字エンコーディング宣言が存在するかどうかにかかわらず、文書のエンコードに使用される実際の文字エンコーディングはUTF-8でなければならない。

引用元:4.2.5.5 文書の文字エンコーディングを指定する – HTML Standard 日本語訳

また、Web における Encoding の仕様書である Encoding Standard日本語訳) でも、UTF-8 のみが「標準」扱いになっており、それ以外の文字エンコーディングは「Legacy」扱いになっています。(こちらは以前からこの内容だったようです)

昔は、Webサイトといえば EUC-JP, ISO-2022-JP, Shift_JIS などの文字エンコーディングが利用されていましたが、これらの文字エンコーディングは完全に過去のものになったと言えそうです。

📂-Web

執筆者:labo


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

Web

シンタックス・ハイライト・ライブラリ「highlight.js」の使い方

シンタックス・ハイライト・ライブラリ「highlight.js」の使い方について説明します。

web development

Webページが読み込む CSS, JS コードから、実際に使われている部分のみを抽出する

Webページが読み込む CSS, JS コードから、実際に使われている部分のみを抽出する方法を紹介します。

Web

AMP for WordPress プラグインを使って WordPressサイトをAMP対応する手順

目次1. AMP とは?なぜ、AMP が必要なのか?AMP フレームワーク1. AMP HTML2. AMP JS3. AMP キャッシュその他2. AMP for WordPress プラグインにつ …

Web

Source Map に関する情報

目次1. Source Map とは?従来の問題点ソースマップ(Source Map)ソースマップに関連するファイルを整理するソースマップの動作ソースマップは誰が作るのか?2. Chrome ブラウザ …

Web

rel=”preload” によってリソースを先読みさせる

目次1. rel=”preload” について読み込みは非同期に実行され、レンダリングをブロックしない通常の読み込み処理の記述が別に必要2. デモページ3. その他の特徴as …