1. 3 セマンティックス、構造、HTML文書のAPI群
    1. 3.1 文書
      1. 3.1.1 Documentオブジェクト
      2. 3.1.2 リソースメタデータの取り扱い
      3. 3.1.3 DOMツリーアクセス機構
    2. 3.2 要素
      1. 3.2.1 セマンティックス
      2. 3.2.2 DOMにおける要素
      3. 3.2.3 HTML element constructors
      4. 3.2.4 要素定義
        1. 3.2.4.1 属性
      5. 3.2.5 コンテンツモデル
        1. 3.2.5.1 "nothing" コンテンツモデル
        2. 3.2.5.2 コンテンツの種類
          1. 3.2.5.2.1 メタデータコンテンツ
          2. 3.2.5.2.2 フローコンテンツ
          3. 3.2.5.2.3 セクショニングコンテンツ
          4. 3.2.5.2.4 ヘディングコンテンツ
          5. 3.2.5.2.5 フレージングコンテンツ
          6. 3.2.5.2.6 エンベディッドコンテンツ
          7. 3.2.5.2.7 インタラクティブコンテンツ
          8. 3.2.5.2.8 パルパブルコンテンツ
          9. 3.2.5.2.9 スクリプトサポート要素
        3. 3.2.5.3 透過的なコンテンツモデル
        4. 3.2.5.4 段落
      6. 3.2.6グローバル属性
        1. 3.2.6.1 title属性
        2. 3.2.6.2 langおよびxml:lang属性
        3. 3.2.6.3 translate属性
        4. 3.2.6.4 dir属性
        5. 3.2.6.5 style属性
        6. 3.2.6.6 data-*属性をもつカスタム非視覚データの埋め込み
      7. 3.2.7 innerText IDL属性
      8. 3.2.8 双方向アルゴリズムに関連する要求
        1. 3.2.8.1 双方向アルゴリズムの書式設定文字に対するオーサリング適合性要求
        2. 3.2.8.2 User agent conformance criteria
      9. 3.2.9 Requirements related to ARIA and to platform accessibility APIs

3 セマンティックス、構造、HTML文書のAPI群

3.1 文書

HTMLユーザーエージェントにおいてすべてのXMLおよびHTML文書は、Documentオブジェクトによって表される。[DOM]

DocumentオブジェクトのURLは、WHATWG DOM標準で定義される。Documentオブジェクトが作成された際の初期設定であるが、Documentオブジェクトの存続期間中に変更することができるものではない。たとえば、ユーザーがページ上のフラグメントナビゲートする場合や、pushState()メソッドが新しいURLとともに呼ばれる場合であるに変更する。[DOM]

対話的なユーザーエージェントは一般にユーザーインターフェイスでDocumentオブジェクトの URL を公開する。これは、サイトが別のものを偽装しようとしているかどうかをユーザーが見分けるための基本メカニズムである。

DocumentcreateDocument()またはcreateHTMLDocument()APIを用いたスクリプトで作成される場合、Documentは即座にready for post-load taskscompletely loadedの両方となる。

文書のリファラーは、Documentが作成された際に設定できる(URLを表す)文字列である。文書のリファラーが明示的に設定されない場合、値は空文字列である。

Documentオブジェクトは、当初は設定されないリロード上書きフラグを持つ。フラグは、特定の状況でdocument.open()およびdocument.write()メソッドによって設定される。フラグが設定された場合、Documentもまたリロードされたときに文書のソースとして使用されるUnicode文字列であるリロード上書きバッファを持つ。

ユーザーエージェントが上書きされたリロードを実行することになっている場合、ソースブラウジングコンテキストを与えられ、以下のように振る舞わなければならない:

  1. sourceブラウジングコンテキストアクティブ文書がもつリロード上書きバッファの値にする。

  2. addressブラウジングコンテキストアクティブ文書URLにする。

  3. HTTPS stateブラウジングコンテキストアクティブ文書HTTPS stateにする。

  4. referrer policyブラウジングコンテキストアクティブ文書リファラーポリシーにする。

  5. CSP listブラウジングコンテキストアクティブ文書CSP listにする。

  6. ボディーsourceであり、ヘッダーリストが`Referrer-Policy`/referrer policyであり、CSPリストCSP listかつ、exceptions enabled flagが設定されreplacement enabledをもつ、HTTPS状態HTTPS stateである新しいレスポンスブラウジングコンテキストナビゲートする。ソースブラウジングコンテキスト上書きリロードアルゴリズムに与えられるものである。ナビゲートアルゴリズムがこの目的のためにDocumentオブジェクトを作成する場合、Documentリロード上書きフラグを設定し、リロード上書きバッファーsourceに設定する。例外を再度投げる。

    ナビゲーションアルゴリズム文書のアドレスを設定する時間が来ると、上書きURLとしてaddressを使用する。

3.1.1 Documentオブジェクト

WHATWG DOM標準は、この仕様が大幅に拡大解釈するDocumentインターフェイスを定義する:

enum DocumentReadyState { "loading", "interactive", "complete" };
typedef (HTMLScriptElement or SVGScriptElement) HTMLOrSVGScriptElement;

[OverrideBuiltins]
partial interface Document {
  // resource metadata management
  [PutForwards=href, Unforgeable] readonly attribute Location? location;
  attribute USVString domain;
  readonly attribute USVString referrer;
  attribute USVString cookie;
  readonly attribute DOMString lastModified;
  readonly attribute DocumentReadyState readyState;

  // DOM tree accessors
  getter object (DOMString name);
  [CEReactions] attribute DOMString title;
  [CEReactions] attribute DOMString dir;
  [CEReactions] attribute HTMLElement? body;
  readonly attribute HTMLHeadElement? head;
  [SameObject] readonly attribute HTMLCollection images;
  [SameObject] readonly attribute HTMLCollection embeds;
  [SameObject] readonly attribute HTMLCollection plugins;
  [SameObject] readonly attribute HTMLCollection links;
  [SameObject] readonly attribute HTMLCollection forms;
  [SameObject] readonly attribute HTMLCollection scripts;
  NodeList getElementsByName(DOMString elementName);
  readonly attribute HTMLOrSVGScriptElement? currentScript; // classic scripts in a document tree only

  // dynamic markup insertion
  [CEReactions] Document open(optional DOMString type = "text/html", optional DOMString replace = "");
  WindowProxy open(USVString url, DOMString name, DOMString features);
  [CEReactions] void close();
  [CEReactions] void write(DOMString... text);
  [CEReactions] void writeln(DOMString... text);

  // user interaction
  readonly attribute WindowProxy? defaultView;
  readonly attribute Element? activeElement;
  boolean hasFocus();
  [CEReactions] attribute DOMString designMode;
  [CEReactions] boolean execCommand(DOMString commandId, optional boolean showUI = false, optional DOMString value = "");
  boolean queryCommandEnabled(DOMString commandId);
  boolean queryCommandIndeterm(DOMString commandId);
  boolean queryCommandState(DOMString commandId);
  boolean queryCommandSupported(DOMString commandId);
  DOMString queryCommandValue(DOMString commandId);

  // special event handler IDL attributes that only apply to Document objects
  [LenientThis] attribute EventHandler onreadystatechange;
};
Document implements GlobalEventHandlers;
Document implements DocumentAndElementEventHandlers;

Documentは、Documentのデータとして届けるために使用されるネットワークチャンネルのセキュリティープロパティを表す、初期に"none"の、HTTPS状態HTTPS ステータス値)を持つ。

Documentは、Documentによって起動されるフェッチで使用されるデフォルトのリファラーポリシーを表す、初期に空文字列の、リファラーポリシーreferrer policy)を持つ。

Documentは、このコンテキストでContent Security PolicyオブジェクトアクティブのリストであるCSPリストを持つ。このリストは、他に指定されない限り空である。

Documentは、初期に空なモジュールマップとなる、モジュールマップを持つ。

3.1.2 リソースメタデータの取り扱い

document . referrer

ユーザーが操作したDocumentURLを返す。ただしブロックされるあるいはそのような文書がない場合を除く。その場合空文字列を返す。

noreferrerリンク型はリファラーを遮断するために使用されうる。

referrer属性は文書のリファラーを返さなければならない。


document . cookie [ = value ]

Documentに適用するHTTPクッキーを返す。クッキーが存在しないかクッキーがこのリソースに適用されない場合、空文字を返す。

新しいクッキーをHTTPクッキーの要素に設定が可能である。

コンテンツがサンドボックス化された固有生成元(たとえば、sandbox属性を持つiframeの中)である場合、 "SecurityError" DOMException例外は取得および設定時に投げられる。

The cookie attribute represents the cookies of the resource identified by the document's URL.

A Document object that falls into one of the following conditions is a cookie-averse Document object:

On getting, if the document is a cookie-averse Document object, then the user agent must return the empty string. Otherwise, if the Document's origin is an opaque origin, the user agent must throw a "SecurityError" DOMException. Otherwise, the user agent must return the cookie-string for the document's URL for a "non-HTTP" API, decoded using UTF-8 decode without BOM. [COOKIES](This is a fingerprinting vector.)

On setting, if the document is a cookie-averse Document object, then the user agent must do nothing. Otherwise, if the Document's origin is an opaque origin, the user agent must throw a "SecurityError" DOMException. Otherwise, the user agent must act as it would when receiving a set-cookie-string for the document's URL via a "non-HTTP" API, consisting of the new value encoded as UTF-8. [COOKIES] [ENCODING]

Since the cookie attribute is accessible across frames, the path restrictions on cookies are only a tool to help manage which cookies are sent to which parts of the site, and are not in any way a security feature.

The cookie attribute's getter and setter synchronously access shared state. Since there is no locking mechanism, other browsing contexts in a multiprocess user agent can modify cookies while scripts are running. A site could, for instance, try to read a cookie, increment its value, then write it back out, using the new value of the cookie as a unique identifier for the session; if the site does this twice in two different browser windows at the same time, it might end up using the same "unique" identifier for both sessions, with potentially disastrous effects.


document . lastModified

ユーザーのローカルタイムゾーンで"MM/DD/YYYY hh:mm:ss"由来のサーバーによって報告されるような、文書の最終更新日時を返す。

最終更新日時が不明の場合、代わりに現在の時刻が返される。

The lastModified attribute, on getting, must return the date and time of the Document's source file's last modification, in the user's local time zone, in the following format:

  1. The month component of the date.
  2. A U+002F SOLIDUS character (/).
  3. The day component of the date.
  4. A U+002F SOLIDUS character (/).
  5. The year component of the date.
  6. A U+0020 SPACE character.
  7. The hours component of the time.
  8. U+003A COLON文字(:)。
  9. The minutes component of the time.
  10. U+003A COLON文字(:)。
  11. The seconds component of the time.

All the numeric components above, other than the year, must be given as two ASCII digits representing the number in base ten, zero-padded if necessary. The year must be given as the shortest possible string of four or more ASCII digits representing the number in base ten, zero-padded if necessary.

The Document's source file's last modification date and time must be derived from relevant features of the networking protocols used, e.g. from the value of the HTTP `Last-Modified` header of the document, or from metadata in the file system for local files. If the last modification date and time are not known, the attribute must return the current date and time in the above format.


document . readyState

Documentが、いったん解析を完了したがまだサブリソースを読み込んでいる時点で"interactive"を、読み込まれた時点で"complete"を、読み込み中の間"loading"を返す。

readystatechangeイベントは、この値が変更したときにDocumentオブジェクトで発火する。

Each document has a current document readiness. When a Document object is created, it must have its current document readiness set to the string "loading" if the document is associated with an HTML parser, an XML parser, or an XSLT processor, and to the string "complete" otherwise. Various algorithms during page loading affect this value. When the value is set, the user agent must fire an event named readystatechange at the Document object.

A Document is said to have an active parser if it is associated with an HTML parser or an XML parser that has not yet been stopped or aborted.

The readyState IDL attribute must, on getting, return the current document readiness.

3.1.3 DOMツリーアクセス機構

要素がhtml要素である場合、文書のhtml要素はその文書要素である。そうでなければnullである。


document . head

head要素を返す。

存在するならば、文書のhead要素は、html要素の子である最初のhead要素である。そうでなければnullである。

取得時に、head属性は、文書のhead要素head要素またはnull)を返さなければならない。

Support: Chrome for Android 55+Chrome 4+iOS Safari 4.0-4.1+UC Browser for Android 11+Firefox 4+Opera Mini all+IE 9+Samsung Internet 4+Android Browser 2.3+Safari 5.1+Edge 12+Opera 11+

Source: caniuse.com


document . title [ = value ]

HTMLに対してtitle要素に与えられるおよびSVGに対してSVG title要素に与えられるものとして、文書のタイトルを返す。

文書のタイトルを更新する設定が可能である。更新する適切な要素が存在しない場合、新しい値は無視される。

存在するならば、文書のtitle要素は文書での(ツリー順で)最初のtitle要素である。そうでなければnullである。

取得時に、title属性は次のアルゴリズムを実行しなければならない:

  1. If the document element is an SVG svg element, then let value be the child text content of the first SVG title element that is a child of the document element.

  2. Otherwise, let value be the child text content of the title element, or the empty string if the title element is null.

  3. Strip and collapse whitespace in value.

  4. Return value.

On setting, the steps corresponding to the first matching condition in the following list must be run:

If the document element is an SVG svg element
  1. If there is an SVG title element that is a child of the document element, let element be the first such element.

  2. Otherwise:

    1. Let element be the result of creating an element given the document element's node document, title, and the SVG namespace.

    2. Insert element as the first child of the document element.

  3. Act as if the textContent IDL attribute of element was set to the new value being assigned.

If the document element is in the HTML namespace
  1. If the title element is null and the head element is null, then abort these steps.

  2. If the title element is non-null, let element be the title element.

  3. Otherwise:

    1. Let element be the result of creating an element given the document element's node document, title, and the HTML namespace.

    2. Append element to the head element.

  4. Act as if the textContent IDL attribute of element was set to the new value being assigned.

そうでなければ

Do nothing.


document . body [ = value ]

body要素を返す。

body要素を置換する設定が可能である。

新しい値がbodyまたはframeset要素でない場合、これは"HierarchyRequestError" DOMException例外を投げる。

文書のbody要素は、body要素またはframeset要素のいずれかであるhtml要素の最初の子である。そのような要素が存在しない場合、nullである。

The body attribute, on getting, must return the body element of the document (either a body element, a frameset element, or null). 設定時に、次のアルゴリズムは実行されなければならない:

  1. If the new value is not a body or frameset element, then throw a "HierarchyRequestError" DOMException and abort these steps.
  2. Otherwise, if the new value is the same as the body element, do nothing. Abort these steps.
  3. Otherwise, if the body element is not null, then replace the body element with the new value within the body element's parent and abort these steps.
  4. Otherwise, if there is no document element, throw a "HierarchyRequestError" DOMException and abort these steps.
  5. Otherwise, the body element is null, but there's a document element. Append the new value to the document element.

document . images

Documentimg要素のHTMLCollectionを返す。

document . embeds
document . plugins

Documentembed要素のHTMLCollectionを返す。

document . links

href属性を持つDocumentaおよびarea要素のHTMLCollectionを返す。

document . forms

Documentform要素のHTMLCollectionを返す。

document . scripts

Documentscript要素のHTMLCollectionを返す。

The images attribute must return an HTMLCollection rooted at the Document node, whose filter matches only img elements.

The embeds attribute must return an HTMLCollection rooted at the Document node, whose filter matches only embed elements.

The plugins attribute must return the same object as that returned by the embeds attribute.

The links attribute must return an HTMLCollection rooted at the Document node, whose filter matches only a elements with href attributes and area elements with href attributes.

The forms attribute must return an HTMLCollection rooted at the Document node, whose filter matches only form elements.

The scripts attribute must return an HTMLCollection rooted at the Document node, whose filter matches only script elements.


collection = document . getElementsByName(name)

nameとともにname属性を持つDocumentで要素のNodeListを返す。

The getElementsByName(name) method takes a string name, and must return a live NodeList containing all the HTML elements in that document that have a name attribute whose value is equal to the name argument (in a case-sensitive manner), in tree order. When the method is invoked on a Document object again with the same argument, the user agent may return the same as the object returned by the earlier call. In other cases, a new NodeList object must be returned.


document . currentScript

要素がクラシックスクリプトを表す限り、現在実行している、script要素またはSVG script要素を返す。再入可能なスクリプト実行の場合には、直近でまだ実行を完了していないものの中で実行を開始しそれを返す。

(たとえば、実行中のスクリプトは、イベントハンドラー、またはタイムアウトであるため)Documentが現在scriptまたはSVG script要素を現在実行していない場合、または現在実行しているscriptまたはSVG scriptモジュールスクリプトである場合はnullを返す。

The currentScript attribute, on getting, must return the value to which it was most recently set. When the Document is created, the currentScript must be initialized to null.

Support: Chrome for Android 55+Chrome 29+iOS Safari 8+UC Browser for Android NoneFirefox 4+Opera Mini NoneIE NoneSamsung Internet 4+Android Browser 4.4+Safari 8+Edge 12+Opera 16+

Source: caniuse.com

このAPIは、APIがグローバルにscriptまたはSVG script要素を公開するので、実装者および標準コミュニティーの支持から離れている。それ自身は、モジュールスクリプトを実行する場合またはシャドウツリーにおけるスクリプトを実行する場合など、新しいコンテキストで利用可能ではない。我々はそのようなコンテキストで実行するスクリプトを識別するための新しい解決法を検討している。これはグローバルに利用可能にさせるものではない。issue #1013を参照。


The Document interface supports named properties. The supported property names of a Document object document at any moment consist of the following, in tree order according to the element that contributed them, ignoring later duplicates, and with values from id attributes coming before values from name attributes when the same element contributes both:

To determine the value of a named property name for a Document, the user agent must return the value obtained using the following steps:

  1. Let elements be the list of named elements with the name name that are in a document tree with the Document as their root.

    There will be at least one such element, by definition.

  2. If elements has only one element, and that element is an iframe element, and that iframe element's nested browsing context is not null, then return the WindowProxy object of the element's nested browsing context.

  3. Otherwise, if elements has only one element, return that element.

  4. Otherwise return an HTMLCollection rooted at the Document node, whose filter matches only named elements with the name name.

Named elements with the name name, for the purposes of the above algorithm, are those that are either:

An embed or object element is said to be exposed if it has no exposed object ancestor, and, for object elements, is additionally either not showing its fallback content or has no object or embed descendants.


Documentインターフェイス上のdir属性は、dirコンテンツ属性と同様に定義される。

3.2 要素

3.2.1 セマンティックス

HTMLにおける要素、属性、および属性値は、ある意味(セマンティックス)を持つよう(この仕様によって)定義される。たとえば、ol要素は順序つきリストを表し、lang属性はコンテンツの言語を表す。

これら定義は、ウェブブラウザーや検索エンジンなどのHTMLプロセッサに、著者が考えてないかもしれないさまざまなコンテキストで文書およびアプリケーションの提示と使用を許可する。

簡単な例として、デスクトップコンピューターのウェブブラウザーのみを考慮した著者によって書かれたウェブページを考えてみる:

<!DOCTYPE HTML>
<html lang="en">
 <head>
  <title>My Page</title>
 </head>
 <body>
  <h1>Welcome to my page</h1>
  <p>I like cars and lorries and have a big Jeep!</p>
  <h2>Where I live</h2>
  <p>I live in a small hut on a mountain!</p>
 </body>
</html>

HTMLは見栄えよりもむしろ意味を伝えるため、ページを一切変更することなく、同じページが携帯電話上のスモールブラウザーによっても使用できる。たとえば、デスクトップと同様に大きな文字である見出しの代わりに、携帯電話のブラウザーは、ページ全体で同じサイズのテキストを使用するが、太字の見出しを持つかもしれない。

しかし、画面サイズにおける当然の違いよりもさらに言うと、画面上のページを表示する代わりに、同じページが、たとえばヘッドフォンを使用してユーザーにページを読みあげるなど、同等に音声合成ベースのブラウザーを使用する目の不自由なユーザーによって使用される可能性がある。見出し用の大きなテキストの代わりに、音声ブラウザーは異なる音量または遅い音声を使用するかもしれない。

それだけではない。ブラウザーはページのどの部分が見出しであるかを知っているので、"前の見出しにジャンプ"または"次の見出しにジャンプ"キーを使用して、ユーザーが迅速に文書操作するために使用できる文書のアウトラインをブラウザーは作成できる。このような機能は、ユーザーが他の方法で素早くページを操作することが非常に困難な場合に、特に音声ブラウザーでは一般的である。

まさにブラウザーを超えて、ソフトウェアはこの情報を利用できるのである。検索エンジンは、より効果的なインデックスページへ見出しを使用する、あるいはそれらの結果からページのサブセクションへのクイックリンクを提供する。ツールは目次(実際に、まさにこの仕様の目次が生成される方法)を作成するために見出しを使用できる。

この例は見出しに焦点を当てているが、HTMLにおけるセマンティックスのすべてに同じ原理が適用される。

著者は、ソフトウェアがページを正しく処理するのを妨げるような、適切な意図されるセマンティック目的以外の要素、属性、または属性値を使用してはならない。

たとえば、企業サイトの見出しを表すことを意図した、次のスニペットは、2行目がサブセクションの見出しであることを意図しないないため、非準拠であるが、単に小見出しまたは副題(同じセクションの下位の見出し)にすぎない。

<body>
 <h1>ACME Corporation</h1>
 <h2>The leaders in arbitrary fast delivery since 1920</h2>
 ...

hgroup要素は、この種の状況を対象とする:

<body>
 <hgroup>
  <h1>ACME Corporation</h1>
  <h2>The leaders in arbitrary fast delivery since 1920</h2>
 </hgroup>
 ...

構文的に正しいにも関わらず、セル内に置かれるデータは明らかに表のデータではなく、cite要素を誤使用したため、次の例における文書は同様に非準拠である:

<!DOCTYPE HTML>
<html lang="en-GB">
 <head> <title> Demonstration </title> </head>
 <body>
  <table>
   <tr> <td> My favourite animal is the cat. </td> </tr>
   <tr>
    <td>
     —<a href="https://example.org/~ernest/"><cite>Ernest</cite></a>,
     in an essay from 1992
    </td>
   </tr>
  </table>
 </body>
</html>

これは、要素のセマンティックスを信頼するソフトウェアを停止させる。たとえば、目の不自由なユーザーに文書内の表の操作を許可された音声ブラウザーは、上記の引用を表として報告し、ユーザーを混乱させる。同様に、ページから作品タイトルを抽出するツールは、実際に人の名前であってタイトルでないにもかかわらず、作品のタイトルとして"Ernest"を抽出する。

この文書の修正版は次のようになる:

<!DOCTYPE HTML>
<html lang="en-GB">
 <head> <title> Demonstration </title> </head>
 <body>
  <blockquote>
   <p> My favourite animal is the cat. </p>
  </blockquote>
  <p>
   —<a href="https://example.org/~ernest/">Ernest</a>,
   in an essay from 1992
  </p>
 </body>
</html>

著者は、将来的に拡張される言語に対して拡張が著しく困難になるため、この仕様または他の適用可能な仕様で許可されない要素、属性、または属性値を使用してはならない。

次の例では、この仕様で許可されていない不適合の属性値("carpet")および不適合の属性("texture")が存在する:

<label>Carpet: <input type="carpet" name="c" texture="deep pile"></label>

代替で正しいマークアップ方法はこうなる:

<label>Carpet: <input type="text" class="carpet" name="c" data-texture="deep pile"></label>

DOM nodes whose node document does not have a browsing context are exempt from all document conformance requirements other than the HTML syntax requirements and XML syntax requirements.

具体的には、template要素のテンプレートコンテンツノード文書は、ブラウジングコンテキストを持たない。たとえば、コンテンツモデルの要件と属性値microsyntaxの要件は、template要素のテンプレートコンテンツには適用されない。この例では、img要素は、template要素の外で無効になるプレースホルダーとなる属性値を持つ。

<template>
 <article>
  <img src="{{src}}" alt="{{alt}}">
  <h1></h1>
 </article>
</template>

However, if the above markup were to omit the </h1> end tag, that would be a violation of the HTML syntax, and would thus be flagged as an error by conformance checkers.

ユーザーエージェントが文書を処理している間に、スクリプトやその他のメカニズムの使用を介して、属性値、テキスト、文書の全体構造は実際に動的に変更するかもしれない。ある瞬間において文書のセマンティックスは、その瞬間における文書の状態によって表されるものであり、したがって、文書のセマンティックスは、時間の経過とともに変化する。変更が発生したものとして、ユーザーエージェントは、文書の見栄えを更新する。

HTMLは、プログレスバーを表すprogress要素を持つ。その"value"属性がスクリプトによって動的に更新される場合、ユーザーエージェントは進行状況の変更を表示するためにレンダリングを更新するだろう。

3.2.2 DOMにおける要素

DOMでHTML要素を表すノードは、この仕様の関連セクションで挙げられるインターフェイスを実装しなければならず、スクリプトに公開ししなければならない。HTML要素の文書が別のコンテキスト内(たとえばXSLT変換の内側)である場合でも、これはXML文書でのHTML要素を含む。

DOM内の要素は概念を表す。これは、要素がセマンティックとして知られる固有のセマンティックスを持つ。

たとえば、ol要素は順序つきリストを表す。

すべてのHTML要素のインターフェイスから継承する、および追加の要求のない要素によって使用されなければならない、基本インターフェイスは、HTMLElementインターフェイスである。

[HTMLConstructor]
interface HTMLElement : Element {
  // metadata attributes
  [CEReactions] attribute DOMString title;
  [CEReactions] attribute DOMString lang;
  [CEReactions] attribute boolean translate;
  [CEReactions] attribute DOMString dir;
  [SameObject] readonly attribute DOMStringMap dataset;

  // user interaction
  [CEReactions] attribute boolean hidden;
  void click();
  [CEReactions] attribute long tabIndex;
  void focus();
  void blur();
  [CEReactions] attribute DOMString accessKey;
  readonly attribute DOMString accessKeyLabel;
  [CEReactions] attribute boolean draggable;
  [CEReactions, SameObject, PutForwards=value] readonly attribute DOMTokenList dropzone;
  [CEReactions] attribute HTMLMenuElement? contextMenu;
  [CEReactions] attribute boolean spellcheck;
  void forceSpellCheck();

  [CEReactions, TreatNullAs=EmptyString] attribute DOMString innerText;
};
HTMLElement implements GlobalEventHandlers;
HTMLElement implements DocumentAndElementEventHandlers;
HTMLElement implements ElementContentEditable;

// Note: intentionally not [HTMLConstructor]
interface HTMLUnknownElement : HTMLElement { };

HTMLElementインターフェイスは、多数の異なる機能に関係するメソッドおよび属性を保持する。したがって、このインターフェイスのメンバーはこの仕様の異なるセクションでさまざまに説明される。


The element interface for an element with name name in the HTML namespace is determined as follows:

  1. If name is bgsound, blink, isindex, multicol, nextid, or spacer, then return HTMLUnknownElement.

  2. If name is acronym, basefont, big, center, nobr, noembed, noframes, plaintext, rb, rtc, strike, or tt, then return HTMLElement.

  3. If name is listing or xmp, then return HTMLPreElement.

  4. Otherwise, if this specification defines an interface appropriate for the element type corresponding to the local name name, then return that interface.

  5. If other applicable specifications define an appropriate interface for name, then return the interface they define.

  6. If name is a valid custom element name, then return HTMLElement.

  7. Return HTMLUnknownElement.

The use of HTMLElement instead of HTMLUnknownElement in the case of valid custom element names is done to ensure that any potential future upgrades only cause a linear transition of the element's prototype chain, from HTMLElement to a subclass, instead of a lateral one, from HTMLUnknownElement to an unrelated subclass.

3.2.3 HTML element constructors

To support the custom elements feature, all HTML elements have special constructor behavior. This is indicated via the [HTMLConstructor] IDL extended attribute. It indicates that the interface object for the given interface will have a specific behavior when called, as defined in detail below.

The [HTMLConstructor] extended attribute must take no arguments, and must not appear on anything other than an interface. It must appear only once on an interface, and the interface must not be annotated with the [Constructor] or [NoInterfaceObject] extended attributes. (However, the interface may be annotated with [NamedConstructor]; there is no conflict there.) It must not be used on a callback interface.

Interface objects for interfaces annotated with the [HTMLConstructor] extended attribute must run the following steps as the function body behavior for both [[Call]] and [[Construct]] invocations of the corresponding JavaScript function object. When invoked with [[Call]], the NewTarget value is undefined, and so the algorithm below will immediately throw. When invoked with [[Construct]], the [[Construct]] newTarget parameter provides the NewTarget value.

  1. Let registry be the current global object's CustomElementRegistry object.

  2. If NewTarget is equal to the active function object, then throw a TypeError and abort these steps.

    This can occur when a custom element is defined using an element interface as its constructor:

    customElements.define("bad-1", HTMLButtonElement);
    new HTMLButtonElement();          // (1)
    document.createElement("bad-1");  // (2)

    In this case, during the execution of HTMLButtonElement (either explicitly, as in (1), or implicitly, as in (2)), both the active function object and NewTarget are HTMLButtonElement. If this check was not present, it would be possible to create an instance of HTMLButtonElement whose local name was bad-1.

  3. Let definition be the entry in registry with constructor equal to NewTarget. If there is no such definition, then throw a TypeError and abort these steps.

    Since there can be no entry in registry with a constructor of undefined, this step also prevents HTML element constructors from being called as functions (since in that case NewTarget will be undefined).

  4. If definition's local name is equal to definition's name (i.e., definition is for an autonomous custom element), then:

    1. If the active function object is not HTMLElement, then throw a TypeError and abort these steps.

      This can occur when a custom element is defined to not extend any local names, but inherits from a non-HTMLElement class:

      customElements.define("bad-2", class Bad2 extends HTMLParagraphElement {});

      In this case, during the (implicit) super() call that occurs when constructing an instance of Bad2, the active function object is HTMLParagraphElement, not HTMLElement.

  5. Otherwise (i.e., if definition is for a customized built-in element):

    1. Let valid local names be the list of local names for elements defined in this specification or in other applicable specifications that use the active function object as their element interface.

    2. If valid local names does not contain definition's local name, then throw a TypeError and abort these steps.

      This can occur when a custom element is defined to extend a given local name but inherits from the wrong class:

      customElements.define("bad-3", class Bad3 extends HTMLQuoteElement {}, { extends: "p" });

      In this case, during the (implicit) super() call that occurs when constructing an instance of Bad3, valid local names is the list containing q and blockquote, but definition's local name is p, which is not in that list.

  6. Let prototype be Get(NewTarget, "prototype"). 例外を再度投げる。

  7. If Type(prototype) is not Object, then:

    1. Let realm be GetFunctionRealm(NewTarget).

    2. Set prototype to the interface prototype object of realm whose interface is the same as the interface of the active function object.

    The realm of the active function object might not be realm, so we are using the more general concept of "the same interface" across realms; we are not looking for equality of interface objects. This fallback behavior, including using the realm of NewTarget and looking up the appropriate prototype there, is designed to match analogous behavior for the JavaScript built-ins.

  8. If definition's construction stack is empty, then:

    1. Let element be a new element that implements the interface to which the active function object corresponds, with no attributes, namespace set to the HTML namespace, local name set to definition's local name, and node document set to the current global object's associated Document.

    2. Perform element.[[SetPrototypeOf]](prototype). 例外を再度投げる。

    3. Set element's custom element state to "custom".

    4. Set element's custom element definition to definition.

    5. Return element.

    This occurs when author script constructs a new custom element directly, e.g. via new MyCustomElement().

  9. Let element be the last entry in definition's construction stack.

  10. If element is an already constructed marker, then throw an "InvalidStateError" DOMException and abort these steps.

    This can occur when the author code inside the custom element constructor non-conformantly creates another instance of the class being constructed, before calling super():

    let doSillyThing = false;
    
    class DontDoThis extends HTMLElement {
      constructor() {
        if (doSillyThing) {
          doSillyThing = false;
          new DontDoThis();
          // Now the construction stack will contain an already constructed marker.
        }
    
        // This will then fail with an "InvalidStateError" DOMException:
        super();
      }
    }

    This can also occur when author code inside the custom element constructor non-conformantly calls super() twice, since per the JavaScript specification, this actually executes the superclass constructor (i.e. this algorithm) twice, before throwing an error:

    class DontDoThisEither extends HTMLElement {
      constructor() {
        super();
    
        // This will throw, but not until it has already called into the HTMLElement constructor
        super();
      }
    }
  11. Perform element.[[SetPrototypeOf]](prototype). 例外を再度投げる。

  12. Replace the last entry in definition's construction stack with an already constructed marker.

  13. Return element.

    This step is normally reached when upgrading a custom element; the existing element is returned, so that the super() call inside the custom element constructor assigns that existing element to this.


In addition to the constructor behavior implied by [HTMLConstructor], some elements also have named constructors (which are really factory functions with a modified prototype property).

Named constructors for HTML elements can also be used in an extends clause when defining a custom element constructor:

class AutoEmbiggenedImage extends Image {
  constructor(width, height) {
    super(width * 10, height * 10);
  }
}

customElements.define("auto-embiggened", AutoEmbiggenedImage, { extends: "img" });

const image = new AutoEmbiggenedImage(15, 20);
console.assert(image.width === 150);
console.assert(image.height === 200);

3.2.4 要素定義

この仕様において各要素は以下の情報を含む定義を持つ:

カテゴリー

要素が属するカテゴリーのリスト。これは、各要素に対するコンテンツモデルを定義する際に使用される。

この要素を使用できるコンテキスト

要素を使用できる場所の非規範的な記述。この情報は、子として、この要素を許可する要素のコンテンツモデルとともに冗長であり、利便性のためだけに提供される。

簡単のために、最も具体的な期待のみが記載される。たとえば、要素はフローコンテンツまたはフレージングコンテンツのいずれかが予期される場所ならどこでも、フローコンテンツフレージングコンテンツの両方を使用できるが、フローコンテンツは予期される場所ならどこでも、フレージングコンテンツもまた予期されるので(すべてのフレージングコンテンツフローコンテンツであるので)、ただ"フレージングコンテンツが予期される場所"とだけ記載されるだろう。

コンテンツモデル

コンテンツがその要素の子や子孫として含めなければならないものの、規範的な記述。

text/htmlにおけるタグ省略

text/html構文で、開始タグと終了タグを省略することができるかどうかの非規範的な記述。この情報は、任意タグのセクションで与えられた規範的要件とともに冗長であり、利便性のみの要素の定義に記載される。

コンテンツ属性

(許可しない場合を除く)要素で指定されてもよい属性の規範的なリスト、およびこれら属性の非規範的な説明。(ダッシュの左側のコンテンツが規範的であり、ダッシュの右側のコンテンツがそうでない。)

DOMインターフェイス

そのような要素が実装しなければならないDOMインターフェイスの規範的な定義。

その後、著者および実装に適用されてもよい追加の規範適合基準とともに、要素が何を表すのかの説明が続く。時に例も含まれる。

3.2.4.1 属性

属性値は、文字列である。特に指定される場合を除き、HTML要素の属性値は、空の文字列を含み、およびそのような属性値を指定することができるテキストに制限はない、任意の文字列値であってもよい。

3.2.5 Content models

この仕様で定義される各要素は、要素の期待されるコンテンツの説明となる、コンテンツモデルを持つ。HTML要素は、要素のコンテンツモデルで説明される要求に一致するコンテンツを持たなければならない。要素のコンテンツは、DOMにおけるその子である。

空白文字は常に要素の間に許可される。ユーザーエージェントは、DOMでTextとしてソースマークアップにおける要素間のこれら文字を表す。空のTextノードおよびそれらの文字の単なる配列から成るTextノードは、要素間の空白文字と見なされる。

要素間の空白文字、コメントノード、および処理命令ノードは、要素の内容が要素の内容モデルと一致させるかどうかを確立する際に無視されなければならず、文書および要素のセマンティックスを定義するアルゴリズムをたどる際に無視されなければならない。

このように、ABが同じ親ノードを持ち、それらの間に他の要素ノードまたは(要素間の空白以外の)Textノードが存在しない場合、要素Aに2番目の要素B先行または後行すると言う。同様に、その要素が要素間の空白、コメントノード、処理命令ノード以外の他のノードが含まない場合、ノードは、要素の唯一の子である。

著者は、各要素に定義された、あるいは明示的に他の仕様によって要求されたものとして明示的に許可される場所以外でHTML要素を使用してはならない。XML複合文書では、それらの要素が関連するコンテキストを提供するものとして定義される場合、これらのコンテキストは、他の名前空間に由来する要素の内部にあるかもしれない。

たとえば、Atom仕様はcontent要素を定義する。そのtype属性が値xhtmlを持つ場合、Atom仕様はcontent要素がHTML div要素を持つことを要求する。したがって、これがこの仕様によって明白に規範的な規定でないにもかかわらず、div要素はそのコンテキストで許可される。[ATOM]

さらに、HTML要素は省略されてもよい(すなわち、親ノードをもたない)。

たとえば、td要素を作成し、スクリプト内のグローバル変数に格納することは、td要素が別の方法でのみtr要素の内部で使用されることになっているにもかかわらず、適合する。

var data = {
  name: "Banana",
  cell: document.createElement('td'),
};
3.2.5.1 "nothing" コンテンツモデル

要素のコンテンツモデルがnothingである場合、要素は、(要素間の空白文字以外)は、Textノードおよび要素ノードを一切含んではならない。

便宜上、ほとんどのHTML要素のコンテンツモデルはまた"nothing"であり、ボイドの要素HTML構文には終了タグがない要素)。しかし、これらは全く別の概念である。

3.2.5.2 コンテンツの種類

HTMLにおいて各要素は、0個以上の、類似の特性を持つグループ要素であるカテゴリーに分類される。次の大まかなカテゴリーがこの仕様で使用されている:

一部の要素はまた、本仕様の他の部分で定義される他のカテゴリーに分類される。

これらのカテゴリーは、次のように関連する:

セクショニングコンテンツ、ヘディングコンテンツ、フレージングコンテンツ、エンベディッドコンテンツ、およびインタラクティブコンテンツはすべてフローコンテンツ型である。メタデータは、時にフローコンテンツとなる。メタデータとインタラクティブコンテンツは時にフレージングコンテンツとなる。エンベディッドコンテンツはまた、フレージングコンテンツ型であり、時にインタラクティブコンテンツとなる。

その他のカテゴリーはまた、特定の目的のために使用される。たとえばフォームコントロールは、一般的な要件を定義するために多数のカテゴリーを用いて指定される。一部の要素は固有の要件があり、特定のカテゴリーに属さない。

3.2.5.2.1 メタデータコンテンツ

メタデータコンテンツは、見栄えまたは後のコンテンツの振る舞いを設定する、または他の文書との関係を設定する、または他の"帯域外の"情報を運搬するコンテンツである。

セマンティックスが主としてメタデータに関連する他の名前空間由来の要素(たとえば、RDF)もまた、メタデータコンテンツである。

したがって、XMLシリアライゼーションにおいて、このようにRDFを使用できる:

<html xmlns="http://www.w3.org/1999/xhtml"
      xmlns:r="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xml:lang="en">
 <head>
  <title>Hedral's Home Page</title>
  <r:RDF>
   <Person xmlns="http://www.w3.org/2000/10/swap/pim/contact#"
           r:about="https://hedral.example.com/#">
    <fullName>Cat Hedral</fullName>
    <mailbox r:resource="mailto:hedral@damowmow.com"/>
    <personalTitle>Sir</personalTitle>
   </Person>
  </r:RDF>
 </head>
 <body>
  <h1>My home page</h1>
  <p>I like playing with string, I guess. Sister says squirrels are fun
  too so sometimes I follow her to play with them.</p>
 </body>
</html>

しかし、これはHTMLシリアライゼーションでは不可能である。

3.2.5.2.2 フローコンテンツ

文書およびアプリケーションのbodyで使用される多くの要素は、フローコンテンツとして分類される。

3.2.5.2.3 セクショニングコンテンツ

セクショニングコンテンツは、見出しおよびフッターの範囲を定義するコンテンツである。

セクショニングコンテンツ要素は潜在的に見出しとアウトラインを持つ。詳細は見出しとセクションの章を参照のこと。

ある要素はまたセクショニングルートである。セクショニングコンテンツとは異なる存在だが、アウトラインを持つ。

3.2.5.2.4 ヘディングコンテンツ

ヘディングコンテンツはセクションのヘッダーを定義する(明示的にセクショニングコンテンツ要素を用いてマークアップされようとなかろうと、またはヘディングコンテンツ自体によって暗黙であろうとなかろうと)。

3.2.5.2.5 フレージングコンテンツ

Spec bugs: 25493

フレージングコンテンツは、文書のテキストおよび段落内レベルでそのテキストをマークアップする要素である。段落からフレージングコンテンツが続く。

フレージングコンテンツとして分類されるほとんどの要素は、自身がフローコンテンツではなく、フレージングコンテンツとして分類される要素のみを含むことができる。

コンテンツモデルのコンテキストにおいてテキストは、何もないか、Textノードのいずれかを意味する。テキストは時に、そのままでコンテンツモデルとして使用されるが、フレージングコンテンツでもあり、要素間の空白文字でもあるかもしれない(Textノードが空であるか、単に空白文字を含む場合)。

Textノードおよび属性値は、Unicode文字から構成されなければならず、U+0000文字を含んではならず、恒久的に未定義のUnicode文字(noncharacters)を含んではならず、空白文字以外の制御文字を含んではならない。この仕様は、明確なコンテキストに応じたTextノードおよび属性値の正確な値に追加の制限を含む。

3.2.5.2.6 エンベディッドコンテンツ

エンベディッドコンテンツは、他のリソースから文書に取り込むコンテンツであるか、文書へ挿入される他の語彙由来のコンテンツである。

HTML名前空間以外の名前空間に基づく、メタデータでなくコンテンツを伝える要素は、この仕様で定義されるコンテンツモデルの目的のためのエンベディッドコンテンツである。(たとえば、MathML、またはSVG。)

一部のエンベディッドコンテンツ要素は、フォールバックコンテンツを持つこともできる。これは外部リソースが使用できない場合(たとえば、サポートされていないフォーマットであるため)に使用されるコンテンツである。もしあれば、要素の定義はどのようなフォールバックであるかを記載する。

3.2.5.2.7 インタラクティブコンテンツ

インタラクティブコンテンツは、特にユーザーとの交流を意図するコンテンツである。

tabindex属性はまた、任意の要素をインタラクティブコンテンツにすることができる。

3.2.5.2.8 パルパブルコンテンツ

一般的な規則として、コンテンツモデルが任意のフローコンテンツまたはフレージングコンテンツを許可する要素は、パルパブルコンテンツであり、かつhidden属性が指定されないそのコンテンツで少なくとも1つノードを持つべきである。

パルパブルコンテンツは、聞く(audio要素)または見る(videoまたはimgまたはcanvas要素)または他の方法で相互作用する(たとえば、インタラクティブなフォームコントロール)ことのできる、一部の子孫の空でないテキストか他のユーザーのいずれかによって提供することで、要素を非空にさせる。

しかし、要素が合法的に空にできる多くのケースがあるように、たとえば、スクリプトによって後で埋められるプレースホルダーとして使用される場合、または要素がテンプレートの一部であり、かつほとんどのページで満たされるが、一部のページで関係しない場合、この要件は厳しい要件ではない。

適合性検査は、オーサリングの援助として、この要件を満たせない要素を見つけるためのメカニズムを制作者に提供するよう推奨される。

次の要素はパルパブルコンテンツである:

3.2.5.2.9 スクリプトサポート要素

スクリプトサポート要素は、自分自身で何も表さない(つまりこれらはレンダリングされない)が、たとえばユーザーに機能を提供するために、スクリプトをサポートするために使用される。

次の要素は、スクリプトサポート要素である:

3.2.5.3 透過的なコンテンツモデル

いくつかの要素は透過的といわれる。コンテンツモデルの説明でそれらの要素は"透過的"とされる。透過的な要素のコンテンツモデルは、その親要素のコンテンツモデルを受け継ぐ。"透過的"であるコンテンツモデルの役割で要求される要素は、透過的な要素がある、透過的な親要素のコンテンツモデルの役割で要求されるものと同じ要素である。

たとえば、ins要素を許可するruby要素のコンテンツモデルの役割は、フレージングコンテンツを許可する役割であり、かつrt要素はフレージングコンテンツではないので、ruby要素の内側でins要素はrt要素を含むことはできない。

一部のケースでは、透過的な要素が相互に入れ子になる場合、プロセスを繰り返し適用する必要がある。

次のマークアップ断片を考えてみよう:

<p><object><param><ins><map><a href="/">Apples</a></map></ins></object></p>

a要素の内側で"Apples"が許可されるかどうかを確かめるために、コンテンツモデルを分析する。a要素のコンテンツモデルは透過的であり、map要素もins要素も、ins要素がみられるobject要素も同様である。object要素はp要素の中にあり、このコンテンツモデルはフレージングコンテンツである。したがって、テキストはフレージングコンテンツなので、"Apples"は許可される。

透過的なコンテンツが親を持たない場合、"透過的"であるそのコンテンツモデルの役割は、代わりに任意のフローコンテンツを受け入れるものとして扱われなければならない。

3.2.5.4 段落

この節で定義されるような用語段落は、p要素の正確な定義以上の使われ方をする。ここで定義される段落の概念は、どのように文書を解釈すべきかを説明するために使われる。p要素は、段落をマークアップするいくつかのうちの1つにすぎない。

典型的な段落は、活版印刷において見られるような、特定の主題を議論する1つ以上の文をもつテキストのブロックを形成する、フレージングコンテンツの連続であるが、より一般の主題に関する分類に対しても用いられる。たとえば、住所もまた段落であり、フォームの一部、署名、詩のスタンザも同様である。

次の例において、セクションに2つの段落がある。段落ではないフレージングコンテンツを含む見出しもある。コメントおよび段落内の空白文字は段落を形成しないことに注意する。

<section>
  <h1>Example of paragraphs</h1>
  This is the <em>first</em> paragraph in this example.
  <p>This is the second.</p>
  <!-- This is not a paragraph. -->
</section>

フローコンテンツ内の段落は、中身を複雑にするainsdelmap要素なしで、文書がどのように見えるかに関連して定義される。なぜなら、以下に最初の2つの例で示すように、混成のコンテンツモデルをもつこれらの要素は、段落の境界をまたぐことができるためである。

一般に、段落の境界をまたぐ要素を持つことは避けた方がよい。このようなマークアップを維持することは困難なことがある。

次の例は、前述の例からマークアップを選び、テキストが変更されたことを示すためにそのマークアップの一部の周囲にinsdel要素を置く(もっともこの場合、正直なところ変更にあまり意味はないが)。この例は、insdel要素をよそに、前のものとちょうど同じ段落を持つことに注目する―ins要素は見出しと最初の段落にまたがっており、del要素は2つの段落間の境界をまたがっている。

<section>
  <ins><h1>Example of paragraphs</h1>
  This is the <em>first</em> paragraph in</ins> this example<del>.
  <p>This is the second.</p></del>
  <!-- This is not a paragraph. -->
</section>

viewコンテンツをもつ文書におけるすべてのainsdel、およびmap要素を置換するDOMのビューにする。そして、viewで、他の種類のコンテンツによって中断されることなくフレージングコンテンツノードの各ランのため、フレージングコンテンツだけでなくフレージングコンテンツ以外のコンテンツを受け入れる要素において、firstをランの最初のノードにし、lastをランの最後のノードにする。エンベティッドコンテンツでも要素間空白でもない少なくとも1つのノードで構成するそのような各ランに対して、段落はfirstの直前からlastの直後まで元のDOMに存在する。(このように段落は、ainsdel、およびmap要素にまたがることができる。)

Conformance checkers may warn authors of cases where they have paragraphs that overlap each other (this can happen with object, video, audio, and canvas elements, and indirectly through elements in other namespaces that allow HTML to be further embedded therein, like SVG svg or MathML math).

段落はまた、p要素によって明示的に構成される。

段落を互いに分離するためにフレージングコンテンツ以外のコンテンツが別の方法でないだろう場合、p要素は個々の段落をワードラップするために使用できる。

次の例において、リンクは第1段落の半分、2つの段落を分離する見出しのすべて、および第2段落の半分にわたる。これは、段落と見出しをまたがっている。

<header>
 Welcome!
 <a href="about.html">
  This is home of...
  <h1>The Falcons!</h1>
  The Lockheed Martin multirole jet fighter aircraft!
 </a>
 This page discusses the F-16 Fighting Falcon's innermost secrets.
</header>

以下はマークアップのもう1つの方法である。今回は、段落を明示し、1つのリンク要素を3つに分割している:

<header>
 <p>Welcome! <a href="about.html">This is home of...</a></p>
 <h1><a href="about.html">The Falcons!</a></h1>
 <p><a href="about.html">The Lockheed Martin multirole jet
 fighter aircraft!</a> This page discusses the F-16 Fighting
 Falcon's innermost secrets.</p>
</header>

フォールバックコンテンツを定義する特定の要素を使用する場合、段落は重複してもよい。たとえば、以下のセクションで:

<section>
 <h1>My Cats</h1>
 You can play with my cat simulator.
 <object data="cats.sim">
  To see the cat simulator, use one of the following links:
  <ul>
   <li><a href="cats.sim">Download simulator file</a>
   <li><a href="https://sims.example.com/watch?v=LYds5xY4INU">Use online simulator</a>
  </ul>
  Alternatively, upgrade to the Mellblom Browser.
 </object>
 I'm quite proud of it.
</section>

5つの段落が存在する:

  1. "You can play with my cat simulator. object I'm quite proud of it."とある段落。ここでobjectobject要素である。
  2. "To see the cat simulator, use one of the following links:"とある段落。
  3. "Download simulator file"とある段落。
  4. "Use online simulator"とある段落。
  5. "Alternatively, upgrade to the Mellblom Browser."とある段落。

最初の段落は他の4つの段落と重複する。"cats.sim"リソースをサポートするユーザーエージェントは、最初の段落のみを表示するが、ユーザーエージェントは、あたかも2番目の段落と同じ段落であったかのように、1段落目の最初の文を表示するという紛らわしいフォールバックを表示し、かつあたかも1段落目の2番目にある文の冒頭であるかのように、最後の段落を表示するだろう。

この混乱を避けるために、明示的にp要素を使用することができる。たとえば:

<section>
 <h1>My Cats</h1>
 <p>You can play with my cat simulator.</p>
 <object data="cats.sim">
  <p>To see the cat simulator, use one of the following links:</p>
  <ul>
   <li><a href="cats.sim">Download simulator file</a>
   <li><a href="https://sims.example.com/watch?v=LYds5xY4INU">Use online simulator</a>
  </ul>
  <p>Alternatively, upgrade to the Mellblom Browser.</p>
 </object>
 <p>I'm quite proud of it.</p>
</section>

3.2.6 グローバル属性

次の属性は共通で、(この仕様で定義されない属性でさえも)すべてのHTML要素で指定してよいものである:

これらの属性は、HTML要素に対する属性としてこの仕様でただ単に定義される。この仕様がこれらの属性を持つ要素を参照する場合、これらの属性を持つものとして定義されない名前空間からの要素は、これらの属性をもつ要素であると考えてはならない。

たとえば、次のXML断片において、"bogus"要素は、リテラル名"dir"をもつ属性を持つにもかかわらず、この仕様で定義されるようにdir属性を持たない。よって、最も内側のspan要素の書字方向は、間接的に"bogus"要素を通してdiv要素から継承される、'rtl'となる。

<div xmlns="http://www.w3.org/1999/xhtml" dir="rtl">
 <bogus xmlns="https://example.net/ns" dir="ltr">
  <span xmlns="http://www.w3.org/1999/xhtml">
  </span>
 </bogus>
</div>

WHATWG DOM標準は、すべての名前空間ですべての要素にclassidおよびslot属性に対するユーザーエージェントの要求を定義する。[DOM]

classidおよびslot属性は、すべてのHTML要素に指定されてもよい。

HTML要素で指定される場合、class属性は、要素が属する様々なクラスを表すスペース区切りトークンの組の値を持たなければならない。

クラスを要素に割り当てることは、クラスのCSSセレクターでのマッチング、DOMにおけるgetElementsByClassName()メソッド、および他のそのような機能に影響を与える。

著者が使用できるclass属性のトークンに追加の制限は存在しないが、著者は、コンテンツの期待するプレゼンテーションを記述する値よりもむしろ、コンテンツの性質を記述する値を使用するよう推奨される。

HTML要素で指定される場合、id属性値は、要素のツリーですべてのIDに共通して固有でなければならず、かつ少なくとも1つの文字を含まなければならない。値は一切の空白文字を含んではならない。

id属性はその要素の固有識別子(ID)を指定する。

IDを取ることができる形式に制限は存在しない。具体的に、IDは数字のみまたは句読点のみで構成することができ、数字やアンダースコアで開始できる、などである。

要素の固有識別子は様々な目的に使用されうる。中でも注目すべきはフラグメントを用いた文書の特定部分へのリンクする方法として、およびCSS由来の特定要素へのスタイル付けする方法としての目的である。

識別子は不透明な文字列である。固有の意味は、id属性の値から導出されるべきではない。

HTML要素に固有なslot属性に適合性要件は存在しない。


よりきめ細かいインターフェイスを公開できるよう支援技術製品が別の方法でHTML要素と属性で可能にするために、支援技術製品への注釈の組が指定できる(ARIA roleおよびaria-*属性)。[ARIA]


以下のイベントハンドラーコンテンツ属性は任意のHTML要素に指定されてもよい:

これら要素が同じ名前をもつWindowオブジェクトのイベントハンドラーを公開するため、アスタリスクとともにマークされる属性は、body要素上で指定される場合、異なる意味を持つ。

これら属性がすべての要素に適用される一方で、属性はすべての要素で役立つわけでない。たとえば、メディア要素のみがユーザーエージェントによって発火されたvolumechangeイベントを受け取るだろう。


カスタムデータ属性(たとえばdata-foldernamedata-msgid)は、任意のHTML要素に指定されてよく、ページ特有のカスタムデータを保存可能である。


HTML文書で、HTML名前空間での要素は指定するxmlns属性を持つかもしれない。もし存在するなら値は正確に"http://www.w3.org/1999/xhtml"のみを持つ。これはXML文書に当てはまらない。

HTMLにおいて、xmlns属性は一切影響しない。これは基本的に魔除けである。It is allowed merely to make migration to and from XML mildly easier. HTMLパーサによって解析される場合、XMLの名前空間宣言属性のように"http://www.w3.org/2000/xmlns/"名前空間ではなく、属性は名前空間なしに終わる。

XMLにおいて、xmlns属性は名前空間宣言メカニズムの一部であり、要素は実際に名前空間を指定されないxmlns属性を持つことはできない。


XML仕様はまた、XML文書における任意の要素上のXML名前空間xml:space属性の使用を許可する。HTMLにおいてデフォルトの振る舞いは空白文字を維持するため、この属性はHTML要素で影響しない。[XML]

text/html構文でHTML要素上のxml:space属性をシリアル化する方法は存在しない。

3.2.6.1 title属性

title属性は、ツールチップに適するような要素に対する助言的な情報を表す。リンクでは、これはタイトルまたは対象リソースの記述であるかもしれない。画像では、画像のタイトルや説明であるかもしれない。段落では、テキストの脚注や解説であるかもしれない。引用では、ソースに関する詳細情報かもしれない。インタラクティブコンテンツでは、要素の用途に対する分類や指示などかもしれない、などである。値はテキストである。

title属性に依存することは、多くのユーザーエージェントがこの仕様で要求されるようなアクセス可能な方法で属性を公開しないため、現在推奨されない(たとえば、ツールチップを出現させるマウスなどのポインティングデバイスが必要になり、これはモダンな携帯端末やタブレットをもつ人のような、キーボードのみのユーザーとタッチのみのユーザーを締め出す)。

この属性が要素から省略される場合、title属性をもつ最も近い先祖HTML要素title属性がその要素にとっても適切であることを意味する。属性を設定することはこれを上書きし、明示的に先祖の助言的な情報がこの要素に関連しないことを示す。空文字列を属性に設定すると、要素は助言的な情報を持たないことを示す。

title属性値がU+000A LINE FEED(LF)文字を含む場合、コンテンツは複数行に分割される。各U+000A LINE FEED(LF)文字は改行を表す。

警告は、title属性内の改行の使用について報告される。

たとえば、実際に次の断片は改行とともに省略語の拡張を定義する。

<p>My logs show that there was some interest in <abbr title="Hypertext
Transport Protocol">HTTP</abbr> today.</p>

linkabbrinputのような一部の要素は、上記で説明されるセマンティックスを越えてtitle属性に対する追加のセマンティックスを定義する。

要素の助言情報は、一度値が返されれれば中止されるアルゴリズムをもつ、次のアルゴリズムが返す値である。アルゴリズムが空文字列を返す場合、助言情報は存在しない。

  1. 要素がlinkstyledfnabbr、またはmenuitem要素である場合:要素がtitle属性を持つ場合、その属性の値を返す。そうでなければ、空文字列を返す。

  2. そうでなければ、要素がtitle属性を持つ場合、その値を返す。

  3. そうでなければ、要素が親要素を持つ場合、親要素の助言情報を返す。

  4. そうでなければ、空文字列を返す。

要素が勧告情報を持つ場合、ユーザーエージェントは、ユーザーに通知すべきである。そうでなければ情報は発見可能でない。


title IDL属性は、titleコンテンツ属性を反映しなければならない。

3.2.6.2 langおよびxml:lang属性

lang属性(名前空間なし)は、要素のコンテンツに対する基本言語およびテキストを含むあらゆる要素の属性に対して指定する。その値は妥当なBCP 47言語タグまたは空文字列でなければならない。属性に空文字列を設定することは第一言語が不明であることを指す。[BCP47]

XML名前空間でのlang属性はXMLで定義されている。[XML]

これらの属性が要素から省略される場合、この要素の言語がもしあれば、その親要素の言語と同じである。

名前空間のないlang属性は任意のHTML要素で使用されてもよい。

XML名前空間でのlang属性は、XML文書でのHTML要素上で使用されてもよい。同様に、関連仕様が許可する(特に、MathMLおよびSVGがそれらの要素で指定されるXML名前空間lang属性を許可する)場合、他の名前空間で使用されてもよい。名前空間なしのlang属性とXML名前空間でのlang属性の両方が同じ要素に指定される場合、ASCII大文字・小文字不区別で比較したときに、これらは正確に同じ値を持たなければならない。

著者は、HTML文書におけるHTML要素XML名前空間内でlang属性を使用してはならない。To ease migration to and from XML, authors may specify an attribute in no namespace with no prefix and with the literal localname "xml:lang" on HTML elements in HTML documents, but such attributes must only be specified if a lang attribute in no namespace is also specified, and both attributes must have the same value when compared in an ASCII case-insensitive manner.

接頭辞なしで名前空間のない属性およびリテラルにローカル"xml:lang"は、言語処理に影響を与えない。


ノードの言語を決定するために、ユーザーエージェントは、XML名前空間におけるlangのセットを持つまたはHTML要素でありかつ名前空間属性のセットなしにおけるlangを持つ(ノードが要素である場合に要素自身を含む)最も近い祖先要素を見なければならない。その属性は、(その値にかかわらず)ノードの言語を指定する。

名前空間なしのlang属性とXML名前空間におけるlang属性の両方が要素に設定される場合、ユーザーエージェントは、XML名前空間におけるlang属性を使用しなければならず、名前空間なしのlang属性は、要素の言語を決定する目的のために無視されなければならない。

If node's inclusive ancestors do not have either attribute set, but there is a pragma-set default language set, then that is the language of the node. プラグマセットのデフォルト言語セットが存在しない場合、もしあれば、(HTTPなど)より高いレベルのプロトコルから言語情報は代わりに最終的なフォールバック言語として使用されなければならない。そのような言語情報が何も存在しない場合、かつより高いレベルのプロトコルが複数の言語を報告する場合、ノードの言語は不明であり、かつ対応する言語タグは空文字列である。

結果の値が認識される言語タグでない場合、その他の言語とは異なる、特定の言語タグを持つ未知の言語として扱われなければならない。データを解釈しないようにラウンドトリップや言語タグを期待する他のサービスとの通信に対して、後続のサービスが言語説明の別のタイプとしてデータを解釈しないように、ユーザーエージェントは、変更されていない間に言語タグを渡すべきであり、かつBCP 47言語タグであるとしてタグ付けされるべきである。[BCP47]

従って、たとえば、lang="xyzzy"をもつ要素は、(たとえばCSSで)セレクター:lang(xyzzy)にマッチしたことになるが、両者が等しくに不正であるにも関わらず、:lang(abcde)とマッチしない。同様に、ウェブブラウザーおよびスクリーンリーダーの作業が要素の言語について一致して通信した場合、万が一スクリーンリーダーが実際にそのタグをもつ言語をサポートした場合、たとえそれが不正であること知っていたとしても、ブラウザーは言語が"xyzzy"であったことをスクリーンリーダーに教える。たとえスクリーンリーダーがBCP 47とエンコーディング言語名の他の構文の両方をサポートし、その別の構文で文字列"xyzzy"がベラルーシ語を意味する手段であっても、スクリーンリーダーは、ベラルーシ語としてテキストを処理開始することは不適切である。なぜなら、"xyzzy"は、ベラルーシ語がBCP 47コードで記述されている手段ではない(BCP 47は、てベラルーシ語に対してコード"be"を使用する)ためである。

結果の値が空文字列である場合、値はノードの言語が明示的に不明であることを意味するものとして解釈されなければならない。


ユーザーエージェントは、(たとえば、辞書の選択のため、または、日付ピッカーなどのフォームコントロールのユーザーインターフェイスのために、適切なフォントや発音の選択において)適切な処理またはレンダリングを決定するために要素の言語を使用してもよい。


lang IDL属性は、名前空間なしのlangコンテンツ属性を反映しなければならない。

3.2.6.3 translate属性

translate属性は、ページがローカライズされる場合に要素の属性値およびそのTextノードの子の値を翻訳するかどうか、または変更せずにそのままにするかどうかを指定するために使用される列挙属性である。

属性のキーワードは、空文字列、yesおよびnoである。空文字列およびyesキーワードはyes状態に対応する。noキーワードはno状態に対応する。さらに、inherit状態という第3の状態が存在する。これは欠損値のデフォルト(および不正な値のデフォルト)である。

(非HTML要素でさえも)各要素は、翻訳可能状態または無翻訳状態のいずれかの翻訳モードを持つ。HTML要素translate属性がyes状態である場合、その要素の翻訳モード翻訳可能な状態となる。そうでなければ、要素のtranslate属性がno状態である場合、その要素の翻訳モード無翻訳状態となる。そうでなければ、要素のtranslate属性はinherit状態となるか、または要素がHTML要素でないかのいずれかであり、したがってtranslate属性を持たない。いずれにせよ、もしあれば要素の翻訳モードが、その親要素と同じ状態となる、または要素が文書要素である場合、翻訳可能状態となる。

要素が翻訳可能状態にある場合、要素の翻訳可能属性とそのTextノードの子の値は、ページがローカライズされる際に翻訳される。

要素が無翻訳状態にある場合、要素の属性値とそのTextノードの子の値は、たとえば要素が人物名やコンピュータープログラム名を含むため、ページがローカライズされるときに、そのままで残される。

以下の属性は翻訳可能属性である:

他の仕様は、翻訳可能な属性でもある他の属性を定義してもよい。たとえば、ARIAは翻訳可能としてaria-label属性を定義する。


取得時に、要素の変換モード翻訳可能である場合、translate IDL属性は、trueを返さなければならず、そうでなければfalseを返さなければならない。設定時に、新しい値がtrueである場合、それはコンテンツ属性値を"yes"に設定しなければならず、そうでなければコンテンツ属性値を"no"に設定しなければならない。

次の例で、サンプルのキーボード入力とサンプルプログラム出力を除き、ページがローカライズされるときに文書内のすべてが翻訳される:

<!DOCTYPE HTML>
<html lang=en> <!-- default on the document element is translate=yes -->
 <head>
  <title>The Bee Game</title> <!-- implied translate=yes inherited from ancestors -->
 </head>
 <body>
  <p>The Bee Game is a text adventure game in English.</p>
  <p>When the game launches, the first thing you should do is type
  <kbd translate=no>eat honey</kbd>. The game will respond with:</p>
  <pre><samp translate=no>Yum yum! That was some good honey!</samp></pre>
 </body>
</html>
3.2.6.4 dir属性

dir属性は、要素のテキスト方向を指定する。属性は、次のキーワードと状態を持つ列挙属性である:

ltrキーワード。ltr状態に対応する。

要素のコンテンツは、明示的に孤立した左から右へのテキストであることを示す。

rtlキーワード。rtl状態に対応する。

要素のコンテンツは、明示的に孤立した右から左へのテキストであることを示す。

autoキーワード。auto状態に対応する。

要素のコンテンツは明示的に孤立したテキストであることを示すが、方向は、プログラムでの要素のコンテンツを用いて(後述)決定される。

この状態で用いられるヒューリスティックは非常に粗雑である(双方向アルゴリズムにおける段落レベルの決定に類似した方法で、強い指向性をもつ最初の文字のみを見る)。著者は、テキストの方向が全く未知である場合、最後の手段としてのみこの値を使用するよう要請し、同様のサーバー側のヒューリスティックを適用できる。[BIDI]

textareaおよびpre要素に対して、ヒューリスティックは段落レベルごとに適用される。

属性は妥当でない値のデフォルトおよび欠損値のデフォルトを持たない。


HTML要素だけでなく、任意の要素で)要素の方向は、'ltr'または'rtl'のいずれかであり、次のリストから最初の適切な一連のステップごとに決定される:

要素のdir属性がltr状態の場合
要素が文書要素であり、かつdir属性が状態を定義されない(すなわち、存在しないまたは妥当でない値を持つ)場合
要素がtype属性がTelephone状態であるinput要素であり、かつdir属性が状態を定義されない場合(すなわち、存在しないか妥当でない値を持つ)

要素の方向は'ltr'となる。

要素のdir属性がrtl状態の場合

要素の方向は'rtl'となる。

type属性がTextSearchTelephoneURLまたはE-mail状態であるinput要素で、かつdir属性がauto状態である要素の場合
textarea要素かつdir属性がauto状態である要素の場合

要素のが双方向性文字の文字型ALまたはRを含み、かつ要素のの前に双方向性文字の文字型Lが存在しない場合、要素の方向は'rtl'となる。[BIDI]

そうでなければ、要素のが空文字列でない場合、または要素が文書要素である場合、要素の方向は'ltr'である。

そうでなければ、要素の方向は、その要素の親要素の方向と同じである。

要素のdir属性がauto状態の場合
要素がbdi要素であり、かつdir属性が状態を定義されない場合(すなわち、存在しないか妥当でない値を持つ)

ツリー順で次の基準に一致する最初の文字を見つける:

そのような文字が見つけられ、その文字が双方向性文字型ALまたはRの場合、要素の方向は'rtl'である。

そのような文字が見つけられ、その文字が双方向性文字型Lである場合、要素の方向は'ltr'である。

そうでなければ、要素が文書要素である場合、要素の方向は'ltr'である。

そうでなければ、要素の方向は、その要素の親要素の方向と同じである。

要素が親要素を持ち、かつdir属性が状態を定義されない場合(すなわち、存在しないか妥当でない値を持つ)

要素の方向は、その要素の親要素の方向と同じである。

dir属性はHTML要素に対してのみ定義されるので、他の名前空間からの要素では存在し得ない。したがって、他の名前空間由来の要素は常に親要素からのみ方向を継承する。つまり、存在しない場合、デフォルトは'ltr'となる。

この要素は、双方向アルゴリズムに関わるレンダリング要件を持つ


属性の文字列が何らかの方法でレンダリングに含まれる際に使用される、HTML要素属性の方向は、下記リストからステップの最初の適切なセットに従って決定される:

属性が方向可能属性かつ要素のdir属性がauto状態である場合

双方向性文字型L、AL、またはRのある属性値の最初の文字を(論理的な順序で)見つける。[BIDI]

そのような文字が見つけられ、その文字が双方向性文字型ALまたはRの場合、属性の方向は'rtl'である。

そうでなければ、属性の方向は'ltr'である。

そうでなければ
属性の方向要素の方向と同じである。

以下の属性は方向可能属性である:


document . dir [ = value ]

もしあれば、html要素dir属性値を返す。

html要素dir属性値を置換するために、"ltr"、"rtl"、"auto"が設定可能である。

html要素が存在しない場合、空文字列を返し新しい値を無視する。

The dir IDL attribute on an element must reflect the dir content attribute of that element, limited to only known values.

The dir IDL attribute on Document objects must reflect the dir content attribute of the html element, if any, limited to only known values. If there is no such element, then the attribute must return the empty string and do nothing on setting.

著者は、CSS不在(たとえば、検索エンジンによって解釈されるような)であっても正しく文書のレンダリングが継続するよう、CSSを使用するよりもテキストの方向を示すためのdir属性を使用するよう強く推奨される。

次のマークアップ断片は、インスタントメッセージの会話である。

<p dir=auto class="u1"><b><bdi>Student</bdi>:</b> How do you write "What's your name?" in Arabic?</p>
<p dir=auto class="u2"><b><bdi>Teacher</bdi>:</b> ما اسمك؟</p>
<p dir=auto class="u1"><b><bdi>Student</bdi>:</b> Thanks.</p>
<p dir=auto class="u2"><b><bdi>Teacher</bdi>:</b> That's written "شكرًا".</p>
<p dir=auto class="u2"><b><bdi>Teacher</bdi>:</b> Do you know how to write "Please"?</p>
<p dir=auto class="u1"><b><bdi>Student</bdi>:</b> "من فضلك", right?</p>

適切なスタイルシートとp要素へのデフォルトの配置スタイルを与えられる、すなわちテキストを段落の開始端へ揃えることで、結果として生じるレンダリングは以下のようになる:

各段落は、独立したブロックとして表示され、ユーザー名(この例では'Student'と'Teacher')を右に流すとともに、コロンの左側に最初のテキストをもつ右揃えとなる、第二段落と最後段落を除いて、段落は左揃えとなる。

前述したように、auto値は万能薬ではない。"正しく?"アラビア語テキストの左側になることが起きるアラビア文字で始まるので、この例の最後の段落は、右から左へのテキストであると誤って解釈される。

3.2.6.5 style属性

すべてのHTML要素は、指定のstyleコンテンツ属性をもってもよい。これは、CSS Style Attributes仕様によって定義されるとおりのスタイル属性である。[CSSATTR]

CSSをサポートするユーザーエージェントにおいて、属性が追加されるまたはその値が変更される際に、属性値は、スタイル属性に指定されたルールに従って、解析されなければならない。[CSSATTR]

しかし、属性のelementおよび"style attribute"で実行される際にelementのインライン挙動はContent Security Policyによってブロックされるべきか?のアルゴリズムが"Blocked"を返す場合、属性の値で定義されるスタイル規則は要素に適用されてはならない。[CSP]

要素のどこでもstyle属性を使用する文書は、属性が削除された場合、それでも理解可能でありかつ使用可能でなければならない。

特に、コンテンツを非表示および表示するstyle属性の使用、または他に文書に含まれない意味の伝達は不適合である。(コンテンツを非表示および表示するには、hidden属性を用いる。)


element . style

要素のstyle属性へCSSStyleDeclarationオブジェクトを返す。

style IDL属性は、CSS Object Model(CSSOM)仕様で定義される。[CSSOM]

次の例で、色を参照する単語は、単語に視覚メディアで関連色を表すようspan要素とstyle属性を用いてマークアップされている。

<p>My sweat suit is <span style="color: green; background:
transparent">green</span> and my eyes are <span style="color: blue;
background: transparent">blue</span>.</p>
3.2.6.6 data-*属性をもつカスタム非視覚データの埋め込み

Support: Chrome for Android 55+Chrome 7+iOS Safari 5.0-5.1+UC Browser for Android 11+Firefox 6+Opera Mini (limited) all+IE 11+Samsung Internet 4+Android Browser 3+Safari 5.1+Edge 12+Opera 11.1+

Source: caniuse.com

カスタムデータ属性は、文字列"data-"で始まる名前空間のない名前をもつ属性であり、ハイフンの後に少なくとも1文字を持ち、XML互換であり、ASCII大文字を含まない。

ASCII大文字での制約はそのような文書に影響しないので、HTML文書においてHTML要素のすべての属性名はASCII小文字を自動的に取得する。

カスタムデータ属性は、ページまたはアプリケーションへ私的なカスタムデータを記憶することを意図する。これ以上適切な属性や要素は存在しない。

この属性は、属性を使用するサイトの管理者に知られないソフトウェアによる使用を意図しない。複数の独立したツールによって使用される一般的な拡張のために、この仕様は明示的に機能を提供するために拡張されるべきである、またはマイクロデータのような技術は(標準化された語彙で)使用されるべきかのいずれかである。

たとえば、音楽に関するサイトは、各トラックの長さを含むカスタムデータ属性でアルバム内のトラックを表すリスト項目に注釈を付けるかもしれない。その後この情報は、ユーザーがトラックの長さでリストをソートできるようにするため、または一定長さのトラックのリストをフィルターリングするために、サイト自体が使用するかもしれない。

<ol>
 <li data-length="2m11s">Beyond The Sea</li>
 ...
</ol>

しかし、このデータを見ることで一定の長さの曲を検索するために、ユーザーがその音楽サイトに関連付けられていない一般的なソフトウェアを使用することは、不適当だろう。

これは、この属性がサイトの独自スクリプトによる使用を意図し、公開で利用可能なメタデータのための一般的な拡張メカニズムでないためである。

同様に、ページ著者は、使用しようとしている翻訳ツールに対して情報を提供するマークアップを書くことができる:

<p>The third <span data-mytrans-de="Anspruch">claim</span> covers the case of <span
translate="no">HTML</span> markup.</p>

この例において、"data-mytrans-de"属性は、フレーズ"claim"をドイツ語に翻訳する際に使用するためのMyTrans製品に特定のテキストを提供する。しかし、標準translate属性はすべての言語で翻訳であることを伝えるために使用される。"HTML"は不変のままである。標準属性が使用可能である場合、使用されるカスタムデータ属性に対するニーズは存在しない。

HTML要素は任意の値とともに、任意の数の指定されたカスタムデータ属性を持ってもよい。

属性が無視され、かつ関連するすべてのCSSが破棄された場合、ページがそれでも使用可能であるよう、著者はこのような拡張を慎重に設計すべきである。

ユーザーエージェントは、これらの属性または値からいかなる実装の振る舞いも導出してはならない。ユーザーエージェントのために意図される仕様は、意味のある値を持つようにこれらの属性を定義してはならない。

JavaScriptライブラリーが使用されるページの一部であると考えられるとして、JavaScriptライブラリーはカスタムデータ属性を使用してもよい。多くの著者によって再利用されるライブラリーの著者は、衝突のリスクを軽減するために、属性名にライブラリーの名前を含むよう推奨される。理にかなっている場合には、著者が無意識のうちに同じ名前を選んだライブラリーが同じページ上で使用できるように、そしてバージョンの相互の互換性がない場合でも、特定ライブラリーの複数のバージョンが同じページ上で使用できるように、ライブラリー著者はまた、正確な名前がカスタマイズ可能な属性名に使用されることを推奨される。

たとえば、"DoQuery"と呼ばれるライブラリーはdata-doquery-rangeのような属性名を使用するかもしれないし、"jJo"と呼ばれるライブラリーはdata-jjo-rangeのような属性名を使用するかもしれない。jJoライブラリーはまた、APIに接頭辞の使用の設定を供給するかもしれない(たとえばJ.setDataPrefix('j2')が、data-j2-rangeのような名前を持つようにする)。


element . dataset

要素のdata-*属性に対してDOMStringMapオブジェクトを返す。

ハイフン付き名前はキャメルケースになる。たとえば、data-foo-bar=""element.dataset.fooBarになる。

dataset IDL属性は、要素のすべてのdata-*属性に対する便利なアクセス機構を提供する。On getting, the dataset IDL attribute must return a DOMStringMap whose associated element is this element.

The DOMStringMap interface is used for the dataset attribute. Each DOMStringMap has an associated element.

[OverrideBuiltins]
interface DOMStringMap {
  getter DOMString (DOMString name);
  [CEReactions] setter void (DOMString name, DOMString value);
  [CEReactions] deleter void (DOMString name);
};

To get a DOMStringMap's name-value pairs, run the following algorithm:

  1. listを名前-値のペアの空のリストにする。

  2. For each content attribute on the DOMStringMap's associated element whose first five characters are the string "data-" and whose remaining characters (if any) do not include any uppercase ASCII letters, in the order that those attributes are listed in the element's attribute list, add a name-value pair to list whose name is the attribute's name with the first five characters removed and whose value is the attribute's value.

  3. list内のそれぞれの名前に対して、小文字のASCII文字が続く名前における各U+002D HYPHEN-MINUS文字(-)に対して、U+002D HYPHEN-MINUS文字(-)を除去し、かつASCII大文字に変換された同じ文字に続く文字を置換する。

  4. listを返す。

The supported property names on a DOMStringMap object at any instant are the names of each pair returned from getting the DOMStringMap's name-value pairs at that instant, in the order returned.

To determine the value of a named property name for a DOMStringMap, return the value component of the name-value pair whose name component is name in the list returned from getting the DOMStringMap's name-value pairs.

To set the value of a new named property or set the value of an existing named property for a DOMStringMap, given a property name name and a new value value, run the following steps:

  1. If name contains a U+002D HYPHEN-MINUS character (-) followed by a lowercase ASCII letter, then throw a "SyntaxError" DOMException and abort these steps.

  2. nameにおける各大文字のASCII文字に対して 文字の前にU+002D HYPHEN-MINUS文字(-)を挿入し、かつASCII小文字に変換される同じ文字を置換する。

  3. nameの先頭に文字列data-を挿入する。

  4. If name does not match the XML Name production, throw an "InvalidCharacterError" DOMException and abort these steps.

  5. Set an attribute value for the DOMStringMap's associated element using name and value.

To delete an existing named property name for a DOMStringMap, run the following steps:

  1. nameにおける各大文字のASCII文字に対して 文字の前にU+002D HYPHEN-MINUS文字(-)を挿入し、かつASCII小文字に変換される同じ文字を置換する。

  2. nameの先頭に文字列data-を挿入する。

  3. Remove an attribute by name given name and the DOMStringMap's associated element.

This algorithm will only get invoked by the Web IDL specification for names that are given by the earlier algorithm for getting the DOMStringMap's name-value pairs. [WEBIDL]

たとえばゲームの一部として、ウェブページが宇宙船を表す要素を望んだ場合、data-*属性とともにclass属性を使用する必要がある:

<div class="spaceship" data-ship-id="92432"
     data-weapons="laser 2" data-shields="50%"
     data-x="30" data-y="10" data-z="90">
 <button class="fire"
         onclick="spaceships[this.parentNode.dataset.shipId].fire()">
  Fire
 </button>
</div>

APIにおいてハイフン付き属性名は、キャメルケースになることに注目すること。

類似の構造とともに以下の引数および要素が与えられるとする:

<img class="tower" id="tower5" data-x="12" data-y="5"
     data-ai="robotarget" data-hp="46" data-ability="flames"
     src="towers/rocket.png" alt="Rocket Tower">

1つは関数splashDamage()がいくつかの引数を取ることが考えられ、第1引数は処理する要素となる:

function splashDamage(node, x, y, damage) {
  if (node.classList.contains('tower') && // checking the 'class' attribute
      node.dataset.x == x && // reading the 'data-x' attribute
      node.dataset.y == y) { // reading the 'data-y' attribute
    var hp = parseInt(node.dataset.hp); // reading the 'data-hp' attribute
    hp = hp - damage;
    if (hp < 0) {
      hp = 0;
      node.dataset.ai = 'dead'; // setting the 'data-ai' attribute
      delete node.dataset.ability; // removing the 'data-ability' attribute
    }
    node.dataset.hp = hp; // setting the 'data-hp' attribute
  }
}

3.2.7 innerText IDL属性

Support: Chrome for Android 55+Chrome 4+iOS Safari 4.0-4.1+UC Browser for Android 11+Firefox 45+Opera Mini all+IE 6+Samsung Internet 4+Android Browser 2.3+Safari 3.2+Edge 12+Opera 9.5-9.6+

Source: caniuse.com

element . innerText [ = value ]

"レンダリングの通りに"要素のテキストコンテンツ返す。

指定された値をもつのでなく、brに変換された改行をもつ要素の子に置換するために、設定することができる。

On getting, the innerText attribute must follow these steps:

  1. If this element is not being rendered, or if the user agent is a non-CSS user agent, then return the same value as the textContent IDL attribute on this element.

  2. Compute a list of items each of which is a string or a positive integer (a required line break count), by applying the following recursive procedure to each child node node of this element in tree order, and then concatenating the results to a single list of items.

    Intuitively, a required line break count item means that a certain number of line breaks appear at that point, but they can be collapsed with the line breaks induced by adjacent required line break count items, reminiscent to CSS margin-collapsing.

    1. Let items be the result of recursively applying this procedure to each child of node in tree order, and then concatenating the results to a single list of items.

    2. If node's computed value of 'visibility' is not 'visible', then let the result of these substeps be items and abort these substeps.

    3. If node has no associated CSS box, then let the result of these substeps be items and abort these substeps. For the purpose of this step, the following elements must act as described if the computed value of the 'display' property is not 'none':

      • select elements have an associated non-replaced inline CSS box whose child boxes include only those of optgroup and option element child nodes;
      • optgroup elements have an associated non-replaced block-level CSS box whose child boxes include only those of option element child nodes; and
      • option element have an associated non-replaced block-level CSS box whose child boxes are as normal for non-replaced block-level CSS boxes.

      items can be non-empty due to 'display:contents'.

    4. If node is a Text node, then for each CSS text box produced by node, in content order, compute the text of the box after application of the CSS 'white-space' processing rules and 'text-transform' rules, let the result of these substeps be a list of the resulting strings, and abort these substeps. The CSS 'white-space' processing rules are slightly modified: collapsible spaces at the end of lines are always collapsed, but they are only removed if the line is the last line of the block, or it ends with a br element. Soft hyphens should be preserved. [CSSTEXT]

    5. If node is a br element, then append a string containing a single U+000A LINE FEED (LF) character to items.

    6. If node's computed value of 'display' is 'table-cell', and node's CSS box is not the last 'table-cell' box of its enclosing 'table-row' box, then append a string containing a single U+0009 CHARACTER TABULATION (tab) character to items.

    7. If node's computed value of 'display' is 'table-row', and node's CSS box is not the last 'table-row' box of the nearest ancestor 'table' box, then append a string containing a single U+000A LINE FEED (LF) character to items.

    8. If node is a p element, then add 2 (a required line break count) at the beginning and end of items.

    9. If node's used value of 'display' is block-level or 'table-caption', then add 1 (a required line break count) at the beginning and end of items. [CSSDISPLAY]

      Floats and absolutely-positioned elements fall into this category.

    10. Let the result of these substeps be items.

  3. Delete any string items whose strings are empty.

  4. Delete any runs of consecutive required line break count items at the start or end of the list.

  5. Replace each remaining run of consecutive required line break count items with a string consisting of as many U+000A LINE FEED (LF) characters as the maximum of the values in the required line break count items.

  6. Return the concatenation of the string items.

Note that descendant nodes of most replaced elements (e.g., textarea, input, and video — but not button) are not rendered by CSS, strictly speaking, and therefore have no CSS boxes for the purposes of this algorithm.

This algorithm is amenable to being generalized to work on ranges. Then we can use it as the basis for Selection's stringifier and maybe expose it directly on ranges. See Bugzilla bug 10583.

On setting, the innerText attribute must follow these steps:

  1. Let document be this element's node document.

  2. Let fragment be a new DocumentFragment object whose node document is document.

  3. Let input be the given value.

  4. Let pointer be a pointer into input, initially pointing at the start of the string.

  5. Let text be the empty string.

  6. While pointer is not past the end of input:

    1. Collect a sequence of characters that are not U+000A LINE FEED (LF) or U+000D CARRIAGE RETURN (CR) characters. Set text to the collected characters.

    2. If text is not the empty string, then append a new Text node whose data is text and node document is document to fragment.

    3. While pointer is not past the end of input, and the character at position is either a U+000A LINE FEED (LF) or U+000D CARRIAGE RETURN (CR) character:

      1. If the character at position is a U+000D CARRIAGE RETURN (CR) character and the next character is a U+000A LINE FEED (LF) character, then advance position to the next character in input.

      2. Advance position to the next character in input.

      3. Append the result of creating an element given document, br, and the HTML namespace to fragment.

  7. Replace all with fragment within this element.

3.2.8 双方向アルゴリズムに関連する要求

3.2.8.1 双方向アルゴリズムの書式設定文字に対するオーサリング適合性要求

HTML要素のコンテンツTextノードをもつHTML要素におけるテキストコンテンツ、および自由形式のテキストを許可するHTML要素の属性のテキストは、U+202AからU+202Eまでの範囲(双方向アルゴリズムの書式設定文字)の文字を含んでもよい。[BIDI]

著者は、手動で双方向アルゴリズムの書式設定文字を維持するよりもむしろ、dir属性、bdo要素、およびbdi要素を使用するよう推奨される。双方向アルゴリズムの書式設定文字は、CSSと互いに不完全に影響しあう。

3.2.8.2 User agent conformance criteria

User agents must implement the Unicode bidirectional algorithm to determine the proper ordering of characters when rendering documents and parts of documents. [BIDI]

The mapping of HTML to the Unicode bidirectional algorithm must be done in one of three ways. Either the user agent must implement CSS, including in particular the CSS 'unicode-bidi', 'direction', and 'content' properties, and must have, in its user agent style sheet, the rules using those properties given in this specification's rendering section, or, alternatively, the user agent must act as if it implemented just the aforementioned properties and had a user agent style sheet that included all the aforementioned rules, but without letting style sheets specified in documents override them, or, alternatively, the user agent must implement another styling language with equivalent semantics. [CSSGC]

The following elements and attributes have requirements defined by the rendering section that, due to the requirements in this section, are requirements on all user agents (not just those that support the suggested default rendering):

3.2.9 Requirements related to ARIA and to platform accessibility APIs

User agent requirements for implementing Accessibility API semantics on HTML elements are defined in HTML Accessibility API Mappings. [HTMLAAM]

Conformance checker requirements for checking use of ARIA role and aria-* attributes on HTML elements are defined in ARIA in HTML. [ARIAHTML]