「三」浏览器中CSS 语法解析过程

CSS 语法解析过程 1.在浏览器系列文章中,今天终点讲下CSS解析这块内容.我们已知浏览器的渲染流程中HTML Parser会生成 DOM树,而 CSS Parser会将解析结果附加到 DOM 树上,如下图: image.png 解析分为词法分析 和 语法分析。 image.png 词法分析,也是编译原理中的术语,从左到右一个字符一个字符的读入源程序,对字符流进行扫描,根据构词规则识别单词。这一过程可以使用lex等工具自动生成。 语法分析,主要任务是在词法分析的基础上,将单词序列组合成各类语法短语,如“程序”, “语句”,“表达式” 解析工作通常会被拆分为两个组件: 词法分析器,负责将输入流分解成有效的字符。 解析器,负责根据不同语言的语法规则来分析文档结构,最后构造出解析树。 词法分析器知道如何去除不相关的字符,比如空格和换行 具体到css解析,因为它是上下文无关的语法,可以利用各种解析器进行解析。webkit 使用Flex 和 Bison 解析器生成器,通过css 语法文件自动创建解析器。解析器将CSS文件解析成StyleSheet对象,且每个对象都包含CSS规则。CSS规则包含选择器和声明对象。 2.CSS 有自己的规则,一般如下: WebKit 使用 Flex 和 Bison 解析器生成器,通过 CSS 语法文件自动创建解析器。Bison 会创建自下而上的移位归约解析器。Firefox 使用的是人工编写的自上而下的解析器。 这两种解析器都会将 CSS 文件解析成 StyleSheet 对象,且每个对象都包含 CSS 规则。CSS 规则对象则包含选择器和声明对象,以及其他与 CSS 语法对应的对象。 image.png 3.CSS 解析过程会按照 Rule,Declaration 来操作: image.png 4.那么他是如何解析的呢,我们不妨打印一下 CSS Rules: 控制台输入: document.styleSheets[0].cssRules 打印出来的结果大致分为几类: cssText:存储当前节点规则字符串 parentRule:父节点的规则 parentStyleSheet:包含 cssRules,ownerNode,rules 规则 … 规则貌似有点看不懂,不用着急,我们接着往下看。 打印出来的结果大致分为几类: 5.CSS 解析和 Webkit 有什么关系? image.png CSS 依赖 WebCore 来解析,而 WebCore 又是 Webkit 非常重要的一个模块。 要了解 WebCore 是如何解析的,我们需要查看相关源码: CSSRule* CSSParser::createStyleRule(CSSSelector* selector) { CSSStyleRule* rule = 0; if (selector) { rule = new CSSStyleRule(styleElement); m_parsedStyleObjects.append(rule); rule->setSelector(sinkFloatingSelector(selector)); rule->setDeclaration(new CSSMutableStyleDeclaration(rule, parsedProperties, numParsedProperties)); } clearProperties(); return rule; } 从该函数的实现可以很清楚的看到,解析器达到某条件需要创建一个 CSSStyleRule 的时候将调用该函数,该函数的功能是创建一个 CSSStyleRule,并将其添加已解析的样式对象列表 m_parsedStyleObjects 中去,这里的对象就是指的 Rule。 注意:源码是为了参考理解,不需要逐行阅读! Webkit 使用了自动代码生成工具生成了相应的代码,也就是说词法分析和语法分析这部分代码是自动生成的,而 Webkit 中实现的 CallBack 函数就是在 CSSParser 中。 CSS 选择器执行顺序 渲染引擎解析 CSS 选择器时是从右往左解析,这是为什么呢?举个例子:

111

222

333

444

我们按照「从左到右」的方式进行分析: 先找到所有 div 节点。 在 div 节点内找到所有的子 div,并且是 class = “jartto”。 然后再依次匹配 p span.yellow 等情况。 遇到不匹配的情况,就必须回溯到一开始搜索的 div 或者 p 节点,然后去搜索下个节点,重复这样的过程。 这样的搜索过程对于一个只是匹配很少节点的选择器来说,效率是极低的,因为我们花费了大量的时间在回溯匹配不符合规则的节点。 我们按照「从右向左」的方式进行分析: 首先就查找到 class=“yellow” 的 span 元素。 接着检测父节点是否为 p 元素,如果不是则进入同级其他节点的遍历,如果是则继续匹配父节点满足 class=“jartto” 的 div 容器。 这样就又减少了集合的元素,只有符合当前的子规则才会匹配再上一条子规则。 综上所述,我们可以得出结论: 浏览器 CSS 匹配核心算法的规则是以从右向左方式匹配节点的。 这样做是为了减少无效匹配次数,从而匹配快、性能更优。 所以,我们在书写 CSS Selector 时,从右向左的 Selector Term 匹配节点越少越好。 不同 CSS 解析器对 CSS Rules 解析速度差异也很大,感兴趣的童鞋可以看看 CSS 解析引擎,这里不再赘述。 参考文档: https://segmentfault.com/a/1190000018759693 https://segmentfault.com/a/1190000021073560

本文章由javascript技术分享原创和收集

发表评论 (审核通过后显示评论):