1.unity urp源码学习一(渲染流程)
2.vue 源码详解(三): 渲染初始化 initRender 、渲染渲染生命周期的平台平台调用 callHook 、异常处理机制
3.Vue源码解析(2)-$mount实现
4.游戏引擎随笔 0x20:UE5 Nanite 源码解析之渲染篇:BVH 与 Cluster 的源码源码 Culling
5.slate.js源码分析(一) —— slate渲染机制
6.UE4-Slate源码学习(六)slate渲染Part2-Paint控件绘制
unity urp源码学习一(渲染流程)
sprt的一些基础:
绘制出物体的关键代码涉及设置shader标签(例如"LightMode" = "CustomLit"),以确保管线能够获取正确的渲染渲染shader并绘制物体。排序设置(sortingSettings)管理渲染顺序,平台平台如不透明物体从前至后排序,源码源码ptrace 源码原理透明物体从后至前,渲染渲染以减少过绘制。平台平台逐物体数据的源码源码启用、动态合批和gpuinstance支持,渲染渲染以及主光源索引等配置均在此进行调整。平台平台
过滤规则(filteringSettings)允许选择性绘制cullingResults中的源码源码几何体,依据RenderQueue和LayerMask等条件进行过滤。渲染渲染
提交渲染命令是平台平台关键步骤,无论使用context还是源码源码commandbuffer,调用完毕后必须执行提交操作。例如,context.DrawRenderers()用于绘制场景中的网格体,本质上是执行commandbuffer以渲染网格体。
sprt管线的基本流程涉及context的命令贯穿整个渲染流程。例如,首次调用渲染不透明物体,随后可能调用渲染半透明物体、天空盒、特定层渲染等。流程大致如下:
多相机情况也通过单个context实现渲染。
urp渲染流程概览:
渲染流程始于遍历相机,如果是游戏相机,则调用RenderCameraStack函数。此函数区分base相机和Overlay相机:base相机遍历渲染自身及其挂载的Overlay相机,并将Overlay内容覆盖到base相机上;Overlay相机仅返回,不进行渲染操作。
RenderCameraStack函数接受CameraData参数,其中包含各种pass信息。添加pass到m_ActiveRenderPassQueue队列是关键步骤,各种pass类实例由此添加至队列。
以DrawObjectsPass为例,其渲染流程在UniversialRenderer.cs中实现。首先在Setup函数中将pass添加到队列,执行时,执行队列内的pass,并按顺序提交渲染操作。
vue 源码详解(三): 渲染初始化 initRender 、生命周期的调用 callHook 、异常处理机制
在Vue的hive 源码解析源码解析中,本文着重于三个关键点:渲染初始化、生命周期调用及其异常处理机制。这些要素构成了Vue实例构建过程的核心,确保了应用在运行时的流畅性和稳定性。渲染初始化
在Vue实例初始化阶段,一系列关键属性和方法被设置,为后续的渲染工作做好准备。其中,$attrs和$listeners的使用虽然在普通开发场景中可能较少涉及,但在高阶组件中却发挥着重要作用。未来,将专门撰写一篇文章详细阐述其使用方法和场景。生命周期调用与callHook
在完成渲染初始化后,Vue实例开始执行生命周期钩子函数,以执行特定的初始化任务。这些生命周期函数以数组形式存储,形成“任务队列”,确保了函数按照预设顺序执行。调用callHook函数触发beforeCreate生命周期,该函数会遍历队列中的每个任务,并以当前组件实例为上下文执行这些函数。值得一提的是,在调用生命周期钩子时,Vue会暂时禁用依赖收集,以避免不必要的渲染操作。这一机制通过pushTarget和popTarget函数实现,确保在执行钩子函数后,状态能正确恢复。异常处理机制
Vue具有完善的异常处理机制,能够确保在遇到错误时,能够优雅地控制和处理。当组件内出现异常时,异常信息会沿组件链向上层组件传播,直至根组件。这一过程能够确保错误信息被妥善处理,避免了错误对应用整体性能的影响。通过配置组件上的errorCaptured属性,开发者可以选择阻止异常向上层组件传播,从而实现更精细的错误管理。 在Vue的生命周期管理和异常处理方面,callHook函数作为触发器,通过遍历生命周期队列执行相应任务。而invokeWithErrorHandling函数则负责处理每个任务函数的执行,确保即使在执行过程中出现异常,好友列表源码也能通过适当的错误处理机制进行统一管理和控制。 综上所述,Vue的渲染初始化、生命周期调用和异常处理机制构成了其高效、灵活且安全的运行基础,为开发者提供了强大的工具集,以构建复杂的应用程序。通过深入理解这些核心部分,开发者能够更有效地利用Vue的特点,实现高效、稳定的应用开发。Vue源码解析(2)-$mount实现
在上一节中,我们了解到Vue实例的创建过程中,构造函数会执行_init()函数,其中关键步骤是调用vm.$mount(vm.$options.el),这标志着实例已开始挂载到DOM。$mount是Vue渲染的核心函数。
本章节我们将深入探讨Vue的渲染过程,但会跳过一些细节,以便在后续章节中详细剖析。首先,理解Vue的两种构建方式是关键:独立构建(包含template编译器)和运行时构建(不包含模板编译器)。独立构建支持服务端渲染,而运行时构建体积更小。
接下来,我们开始分析Vue源码。$mount方法的实现与平台和构建方式相关,这里我们关注运行时版本。在src/platforms/web/entry-runtime-with-compiler.js中,$mount被添加到Vue原型上,它接收el参数,可能是字符串或DOM元素。
当el为字符串时,会通过query方法将其转换为DOM节点。然后判断el不能为body或html,以防止意外覆盖。如果没有render函数,会根据template生成render,同时处理多模板形式。getOuterHTML函数获取el的内容和DOM。
$mount最终调用mount函数,这个过程涉及核心的mountComponent方法,生成虚拟Node并实例化渲染Watcher,其回调中调用updateComponent更新DOM。wrk 源码下载这部分在core/instance/lifecycle.js中,会检查render函数并处理特殊情况,如未定义或使用template语法的runtime-only版本。
updateComponent是渲染和更新的核心函数,由Watcher(在'src/core/observer/watch.js'定义)在数据变化时调用。Watcher在初始化时执行回调,当数据更新时也执行。整个过程体现了观察者模式,$mount中调用updateComponent的过程涉及template到render的转换,以及初次渲染或数据变更时的调用。
虽然我们已经概述了$mount的流程,但关于render函数的编译步骤并未深入讲解。编译过程包括添加web平台特性、解析template为AST、优化节点、生成render函数字符串并缓存。下一节将详细剖析这五个步骤的源码实现,敬请期待。
游戏引擎随笔 0x:UE5 Nanite 源码解析之渲染篇:BVH 与 Cluster 的 Culling
Nanite遵循的设计理念是三角形的绘制数量超过像素数量就是一种浪费。UE5中的Nanite技术在EA版本发布后揭开了面纱,其渲染性能令人惊叹,本文尝试从源码层面解析Nanite的实现技术,详细讲解Nanite的实现细节,以供开发者参考。
Nanite在GPU端流程如下:
1. **Nanite::Streaming**:异步上传Cluster渲染数据,基于上一帧回读的Cluster Page Request数据进行。
2. **Nanite::InitContext**:初始化Culling上下文的GPU相关数据。
3. **Nanite::CullRasterize**:执行剔除与光栅化,包含生成深度目标、执行基础渲染以及生成阴影等步骤。
4. **Nanite::EmitDepthTargets**:根据Visibility Buffer生成深度相关的Buffer,如Scene Depth、Stencil、Velocity、Material Depth等。
5. **Nanite::BasePass**:使用Visibility Buffer和Cluster相关Buffer输出Deferred Rendering所需的G-Buffer。
6. **Nanite Shadows**:生成阴影所需的深度信息,仅包含InitContext和CullRasterize两步。
7. **Nanite::Readback**:回读PersistentCull pass产生的Cluster Page Request数据。
本文重点解析CullRasterize步骤中的PersistentCull pass源码。
为了在GPU上高效执行Culling,Nanite预生成了BVH(Bounding Volume Hierarchy),每个节点最多包含8个子节点,叶节点存储实际的windows nt源码Cluster索引数据。但要在GPU中实现高效的层次遍历且负载均衡并非易事,设计的不合理会导致性能下降、GPU线程闲置。
UE5的Nanite在GPU端实现了一种高效的遍历机制,性能高且负载均衡,GPU在整个过程中几乎满负荷运行。BVH和Cluster数据结构与存储方式都围绕着高效遍历和负载均衡的目标设计。
**关键Buffers数据结构**:
- **CandidateNodesAndClusters**:存储候选BVH Node和Cluster信息的全局Buffer,内存布局包括待处理的Cluster Group总数、所有候选Cluster Packed数据和所有候选BVH Node Packed数据。
- **MainAndPostPassPersistentStates**:存储Culling过程中的状态数据,包括用于写入BVH Node的读写偏移、Cluster读写偏移等。
- **InstanceCull**:执行对象实例级别的可见剔除,将可见的BVH Root Node存储在CandidateNodesAndClusters中。
- **PersistentClusterCull**:充分利用GPU线程,避免空闲,分为Node和Cluster处理两个阶段,通过组内线程同步和多线程并行处理,实现负载均衡。
**BVH Node Culling解析**:
1. 每组线程计算需要处理的候选BVH节点,通过原子操作统计有效节点数量,并在处理完成时切换至Cluster Culling。
2. 通过组内线程索引计算节点和子节点的索引,执行子节点的Culling处理,同时通过队列管理新产生的候选节点。
3. 优化候选Cluster存储,减少GPU Buffer写入开销。
**Cluster Culling解析**:
1. 处理存储在队列中的候选Cluster,通过编码和同步机制查找需要处理的Cluster。
2. 执行真正的Culling逻辑,包括可见性判断、硬件或软件光栅化等。
3. 将可见的Cluster写入全局缓冲,根据光栅化类型顺序存储,并在Post Pass中再次执行Culling流程。
解析至此,UE5的Nanite技术通过高效的GPU算法和数据结构实现了强大的渲染性能,使得百万面的高精度模型在老显卡上也能实现流畅运行。UE5团队的设计与工程实现能力令人敬佩,其精神和勇气引领了行业技术的前沿。通过深入源码学习,开发者可以深入了解先进的设计思想和工程实现方法,提升自己的技术实力。
slate.js源码分析(一) —— slate渲染机制
富文本编辑器中的可见内容主要由文档内容和光标两部分组成。本文将详细介绍Slate在文档内容和光标方面的渲染机制。
Slate文档的结构包含元素(Element)和文本(Text)两类节点。这些节点类似于DOM树,可以嵌套结构。用户在元素或文本上添加扩展属性,以提供渲染节点所需的数据。
文档的截图与对应的Slate值之间存在对应关系,这种关系帮助开发者直观理解文档的渲染过程。
Slate组件树类似于DOM树,对应于Slate值的数据结构。文档区域的顶部负责更新选择数据、文档树内容,并提供DOM事件API(如onKeydown和onClick)。
节点数据被渲染为HTML,允许用户自定义渲染过程,通过renderElement方法实现。根据装饰的不同,文本会被分割成相应数量的leaf。
文本内容的渲染则通过renderLeaf方法来控制文本内容的样式。
Slate值的更新逻辑利用React技术,将文档数据实时渲染为DOM结构。当contenteditable为true的元素被修改时,会触发beforInput事件,通过监听这一事件,实现文档内容的实时同步。
在使用Slate时,输入法问题是一个常见挑战。本文将简要介绍输入法的工作原理及其常见bug,并分析解决方法。
正常键盘输入仅触发beforInput事件,而使用输入法时,除了beforInput事件,还会触发Composition事件。这三个事件分别对应输入法开始、内容更新和结束的过程。在输入法输入期间,如果实时修改文档内容,会导致与输入法冲突。因此,在CompositionUpdate期间,Slate Value不会做任何更新,直至CompositionEnd时再进行更新。遇到报错情况时,通常是因为在CompositionStart时文档内容被删除,而在CompositionEnd时找不到对应的DOM节点,引发错误。解决办法是在CompositionStart时更新文档值以避免冲突。
解决输入法问题的一个方案是fork源码。通过这种方式,可以确保Slate与输入法协同工作,提高用户体验。
Slate Selection数据结构与DOM Selection类似,由锚点(anchor)和焦点(focus)两个点组成。了解详细信息可以参考MDN Selection文档。
Selection的更新机制依赖于React完成渲染。在每次Selection值发生变化时,会在useEffect中更新DOMSelection。同时,监听window.document上的selectionchange事件以更新Slate Selection值。
后续计划继续深入探讨Slate源码分析,包括历史记录机制、从Slate 0.升级到0.的实战指南、数据模型、序列化机制、normalize机制等,敬请期待。
最后,附上招聘广告。百度如流团队正面向北京、上海、深圳等地招聘,提供丰富的岗位选择,欢迎有意者进行内推。
UE4-Slate源码学习(六)slate渲染Part2-Paint控件绘制
上一篇文章介绍了绘制一个SWindow的初期步骤,即计算整个UI树的控件大小,为绘制做准备。文章随后深入探讨了绘制流程的第二步,即执行FSlateApplication::PrivateDrawWindows()后,开始调用SWidget::Paint()函数,每个控件随后实现其虚函数OnPaint()。
在这一过程中,绘制参数被封装在FPaintArgs中,作为Paint和OnPaint过程中的关键引用参数。FSlateRHIRenderer与FSlateDrawBuffer是继承自FSlateRenderer的类,作为FSlateApplicationBase的全局变量,在构造时创建。在绘制过程中,通过GetDrawBuffer()函数可获取到FSlateDrawBuffer对象。
FSlateDrawBuffer实现了Slate的绘制缓冲区,内部封装了FSlateWindowElementList数组,用于存储多个SWindow下的绘制元素列表。每个SWindow通过AddWindowElementList()返回一个元素列表。
FSlateWindowElementList负载了SWindow内的所有图元信息,内部封装了FSlateDrawElement的数组,包含Cached和Uncached元素,以及SWindow的指针和用于渲染的批处理数据FSlateBatchData。
FSlateDrawElement是构建Slate渲染界面的基本块,封装了UI树节点控件需要渲染的相关信息,如渲染变换、位置、大小、层级ID、绘制效果等,以及后续渲染阶段需要的相关数据。
在Paint流程中,处理当前传入的SWindow和ChildWindows,首先判断窗口是否可见和是否最小化,然后从参数封装的OutDrawBuffer中获取WindowElementList。调用SWindow的PaintWindow()函数开始绘制窗口,并最终返回所有子控件计算完的最大层级。接着,子窗口递归绘制。
PaintWindow()函数在绘制窗口时,首先调用SetHittestArea()设置点击区域,HittestGrid会判断窗口大小是否改变,若不变则仅更新窗口在屏幕中的位置。构造FPaintArgs参数后,将其封装到FSlateInvalidationContext中。
FSlateInvalidationRoot类的PaintInvalidationRoot()函数可以作为控件树的根节点或叶子节点(SInvalidationPanel),构建快速路径避免每次绘制都计算大小和Paint函数,有利于优化。本篇文章主要分析正常慢速路径调用流程,优化相关将另文分析。
PaintSlowPath()函数从SWindow开始调用Paint()函数,并定义LayerId从0开始作为参数,进行实际的绘制相关计算。
Paint()函数首先处理裁剪、透明度混合、坐标转换等代码。若SWidget包含NeedsTick掩码,则调用Tick函数,我们在日常开发中通过蓝图或lua使用Tick函数时即调用到这里,通过SObjectWidget::Tick调用到UUserWidget::NativeTick供实现Tick。构造FSlateWidgetPersistentState PersistentState作为SWidget的变量,表示Paint时的状态。
PersistentState.CachedElementHandle将当前SWidget存储到FSlateWindowElementList中的WidgetDrawStack数组中。
更新FPaintArgs中的父节点参数和继承可点击测试参数,判断点击测试状态,然后将当前SWidget添加到点击测试中。调用虚函数OnPaint,由控件自己实现。
OnPaint()函数参数包括绘制参数引用、几何体、裁剪矩形、缓冲元素列表、层级、控件风格、父节点状态等。最后处理重绘标签、延迟绘制相关内容、UpdateWidgetProxy()根据缓存句柄更新快速路径中需要处理标记设置为Volatile不稳定状态的SWidget。
虚函数OnPaint()由子类自己实现,本文列举了SImage、SButton、SCompoundWidget和SConstraintCanvas的OnPaint()示例代码学习。
在SImage中,简单判断Brush是否存在以及BrushDrawType的类型,然后调用FSlateDrawElement::MakeBox将控件添加到缓冲区元素列表中。
SButton继承自SCompoundWidget,GetBorder()根据当前按钮状态返回ui中设置的Enabled、Press、Hover、Disabled等状态的Brush。
SCompoundWidget作为合成节点,有且只能有一个子节点,且在Paint时强制将子节点的LayerId+1,同时SCompoundWidget可以单独设置混合颜色和透明度,影响子节点。
SConstraintCanvas作为SWidget的基类对应UMG中常用的UCanvasPanel,通过ArrangeLayeredChildren()对孩子进行层级排序,并根据孩子的层级是否相同存储bool值在ChildLayers中。遍历所有孩子,判断是否开启新层级,递归调用Paint函数,最后返回最大层级。
SConstraintCanvas::ArrangeLayeredChildren函数中,获取设置bExplicitChildZOrder,表示可以将同层一次渲染,有利于提高渲染器批处理。对所有孩子排序,排序规则为FSortSlotsByZOrder。遍历所有孩子,判断可见性掩码、计算偏移、锚点、位置、拉伸缩放等,封装成FArrangedWidget存储到ArrangedChildren中,用于OnPaint时有序遍历。判断每个孩子ZOrder是否相同,相同则bNewLayer为false,大于LastZOrder则将bNewLayer设置为true,最终存储到ArrangedChildLayers中,用于OnPaint函数判断是否将layerId+1。
FSlateDrawElement::MakeBox()函数在OnPaint之后调用,将绘制控件的相关信息通过创建FSlateDrawElement绘制元素对象,添加到SWindow管理的FSlateWindowElementList元素列表中。创建Payload用于存储贴图等相关信息,根据控件Paint过程中的参数调用Element.Init初始化绘制元素,得到为该控件绘制创建的FSlateDrawElement对象。
总结整个Slate绘制流程的第二步,我们没有分析快速处理和优化细节,而是按照正常绘制流程分析代码。通过从PaintWindow开始遍历整个控件树,处理每个空间节点的Paint、OnPaint函数,最终目的是给每个控件创建一个FSlateDrawElement对象,存储渲染线程绘制所需的相关信息,并添加到FSlateWindowElementList中。理解了整个调用流程,整个过程较为清晰,本文基于UE4版本4..2。