HTML 块
HTML 块是一组被视为原生 HTML 的行(并且不会在 HTML 输出中进行转义)。
有七种 HTML 块,可以通过它们的起始和结束条件来定义。这种块以满足起始条件的行开始(在最多三个空格可选缩进之后)。如果没有遇到满足结束条件的行,它就以满足匹配结束条件的第一个后续行,或者文档的最后一行,或其他容器块结束。如果第一行同时满足开始条件和结束条件,则该块将仅包含该行。
开始条件: 行以字符串
<script
,<pre
或<style
(不区分大小写)开头,后跟空格,字符串>
或行尾。
结束条件: 行包含结束标签</script>
,</pre>
或</style>
(不区分大小写;它不需要与起始标签匹配)。开始条件: 行以字符串
<!--
开头。
结束条件: 行包含字符串-->
。起始条件: 行以字符串
<?
开头。
结束条件: 行包含字符串?>
。起始条件: 行以字符串
<!
开头,后跟一个大写的 ASCII 字母。
结束条件: 行包含字符>
。起始条件: 行以字符串
<![CDATA[
开头。
结束条件: 行包含字符]]>
。起始条件: 行以字符串
<
或</
开头,后跟其中一个字符串(不区分大小写)address
,article
,aside
,base
,basefont
,blockquote
,body
,caption
,center
,col
,colgroup
,dd
,details
,dialog
,dir
,div
,dl
,dt
,fieldset
,figcaption
,figure
,footer
,form
,frame
,frameset
,h1
,h2
,h3
,h4
,h5
,h6
,head
,header
,hr
,html
,iframe
,legend
,li
,link
,main
,menu
,menuitem
,nav
,noframes
,ol
,optgroup
,option
,p
,param
,section
,source
,summary
,table
,tbody
,td
,tfoot
,th
,thead
,title
,tr
,track
,ul
, 后跟空格, 在行尾是字符>
或者/>
。
结束条件: 行后跟一个空行。起始条件: 行以完整的打开标签或闭合标签(除了
script
,style
或pre
之外的任何标签名称)开始,后面只有空格或行尾。
结束条件: 行后紧跟空行。
HTML 块会一直连续,直到它们被适当的结束条件,或文档的最后一行,或其他容器块关闭。这意味着 HTML 块中可能被识别为起始条件的任何 HTML 都将被解析器忽略并按原样传递,而不会更改解析器的状态。
例如,<table>
起始的 HTML 块中的 <pre>
不会影响解析器状态; 当 HTML 块由启动条件 6 启动时,它将在任意空白行结束。这可能是令人惊讶的:
示例 118
Markdown | HTML | 效果 |
---|---|---|
|
|
在这种情况下,HTML 块由换行符终止,**Hello**
文本保持逐字逐句且正常的解析,如此周而复始,并有段落,强调的 world
,内联和块类型的 HTML 伴随。
除类型 7 之外的所有类型的 HTML 块都可能会中断段落。类型 7 的块可能不会中断段落。 (此限制旨在防止对包裹段落中的长标签进行不必要的解释,比如起始的 HTML 块。)
一些简单的例子如下。以下是类型 6 的一些基本的 HTML 块:
示例 119
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 120
Markdown | HTML | 效果 |
---|---|---|
|
|
块也可以以闭合标签开头:
示例 121
Markdown | HTML | 效果 |
---|---|---|
|
|
这里我们有两个 HTML 块,它们之间有 Markdown 段落:
示例 122
Markdown | HTML | 效果 |
---|---|---|
|
|
第一行上的标签可以是局部的,只要它被分割成有空格的结果:
示例 123
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 124
Markdown | HTML | 效果 |
---|---|---|
|
|
无需关闭打开的标签:
示例 125
Markdown | HTML | 效果 |
---|---|---|
|
|
部分标签甚至不需要完成(垃圾进,垃圾出):
示例 126
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 127
Markdown | HTML | 效果 |
---|---|---|
|
|
初始标签甚至不需要是有效标签,只要它像一个标签一样:
示例 128
Markdown | HTML | 效果 |
---|---|---|
|
|
在类型 6 的块中,初始标签本身不需要在一行上:
示例 129
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 130
Markdown | HTML | 效果 |
---|---|---|
|
|
直到下一个空行或文档结尾的所有内容都包含在 HTML 块中。因此,在下面的示例中,看起来像 Markdown 代码块的实际上是 HTML 块的一部分,它一直持续到空白行或文档的末尾:
示例 131
Markdown | HTML | 效果 |
---|---|---|
|
|
要创造标签带有 不在(6)中的块级标签列表中的 HTML 块,必须将标签单独放在第一行(并且必须完成):
示例 132
Markdown | HTML | 效果 |
---|---|---|
|
|
在类型 7 的块中,标签名称可以是任意内容:
示例 133
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 134
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 135
Markdown | HTML | 效果 |
---|---|---|
|
|
这些规则旨在允许我们使用可用作块级或内联级标签的标签。<del>
标签是一个很好的示例。我们可以用三种不同的方式用 <del>
标签包围内容。在这种情况下,我们会得到一个原生的 HTML 块,因为 <del>
标签本身就是一行:
示例 136
Markdown | HTML | 效果 |
---|---|---|
|
|
在这种情况下,我们会得到一个原生的 HTML 块,它只包含 <del>
标签(因为它以下面的空行结束)。所以内容被 CommonMark 规范解释:
示例 137
Markdown | HTML | 效果 |
---|---|---|
|
|
最后,在这种情况下,<del>
标签在 CommonMark 段落中被解释为原生 HTML。(因为标签本身不在一行,我们得到内联 HTML 而不是 HTML 块。)
示例 138
Markdown | HTML | 效果 |
---|---|---|
|
|
旨在包含字面量内容(script
, style
, pre
),注释,处理指令和声明的 HTML 标签,它们的处理方式有所不同。这些块不是以第一个空行结束,而是在包含相应结束标签的第一行结束。因此,这些块可以包含空行:
一个 pre 标签(类型 1):
示例 139
Markdown | HTML | 效果 |
---|---|---|
|
|
一个 script 标签(类型 1):
示例 140
Markdown | HTML | 效果 |
---|---|---|
|
|
一个 style 标签(类型 1):
示例 141
Markdown | HTML | 效果 |
---|---|---|
|
|
如果没有匹配的结束标签,则该块将在文档的末尾(或闭合的块引号列表项)结束:
示例 142
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 143
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 144
Markdown | HTML | 效果 |
---|---|---|
|
|
结束标签可以与开始标签位于同一行:
示例 145
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 146
Markdown | HTML | 效果 |
---|---|---|
|
|
注意,结束标签之后的最后一行上的任何内容都将包含在 HTML 块中:
示例 147
Markdown | HTML | 效果 |
---|---|---|
|
|
一个注释(类型 2):
示例 148
Markdown | HTML | 效果 |
---|---|---|
|
|
一个处理指令(类型 3):
示例 149
Markdown | HTML | 效果 |
---|---|---|
|
|
一个声明(类型 4):
示例 150
Markdown | HTML | 效果 |
---|---|---|
|
|
CDATA (类型 5):
示例 151
Markdown | HTML | 效果 |
---|---|---|
|
|
开始标签可以缩进 1-3 个空格,但不能缩进 4 个空格:
示例 152
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 153
Markdown | HTML | 效果 |
---|---|---|
|
|
1-6 类型的 HTML 块可以中断段落,并且不需要以空行开头。
示例 154
Markdown | HTML | 效果 |
---|---|---|
|
|
然而,除文档末尾外,还需要以下空白行,除以上类型 1-5 的块外:
示例 155
Markdown | HTML | 效果 |
---|---|---|
|
|
类型 7 的 HTML 块不能中断段落:
示例 156
Markdown | HTML | 效果 |
---|---|---|
|
|
此规则不同于 John Gruber 的原始 Markdown 语法规范,该规范说:
唯一的限制是块级 HTML 元素 - 例如
<div>
,<table>
,<pre>
,<p>
等 - 必须用空行与周围内容分开,并且不应使用 tab 或空格缩进块的开始和结束标签。
在某种程度上,Gruber 的规则比这里给出的规则更具限制性:
- 它要求 HTML 块前面有一个空行。
- 它不允许开始标签缩进。
- 它需要一个匹配的结束标签,它也不允许缩进。
大多数 Markdown 实现(包括 Gruber 自己的一些实现)并不尊重这些限制的全部。
但是,有一个方面,Gruber 的规则比这里给出的规则更自由,因为它允许在 HTML 块中出现空行。在这里禁止它们有两个原因。首先,它消除了解析平衡标签的需要,这是昂贵的,并且如果没有找到匹配的结束标签,则可能需要从文档的末尾回溯。其次,它提供了一种非常简单灵活的方法,可以在 HTML 标签中包含 Markdown 内容:只需使用空行将 Markdown 与 HTML 分开:
对比:
示例 157
Markdown | HTML | 效果 |
---|---|---|
|
|
示例 158
Markdown | HTML | 效果 |
---|---|---|
|
|
如果打开的标签具有属性 markdown=1
,则某些 Markdown 实现采用了将标签内的内容解释为文本的约定。上面给出的规则似乎是一种更简单,更优雅的方式来实现相同的表达能力,这也很容易解析。
主要的潜在缺点是,人们无法再将 HTML 块粘贴到 Markdown 文档中,并具有 100% 的可靠性。但是,在大多数情况下,这样可以正常工作,因为 HTML 中的空行通常后跟 HTML 块标签。对于示例:
示例 159
Markdown | HTML | 效果 |
---|---|---|
|
|
但是,如果内部标签缩进,并用空格分隔,则会出现问题,因为它们将被解释为缩进的代码块:
示例 160
Markdown | HTML | 效果 |
---|---|---|
|
|
幸运的是,通常不需要空行,它是可以没有的。例外是在 <pre>
标签内,但如上所述,以<pre>
开头的原生 HTML 块可以包含空行。