1.ONNX-Runtime一本通:综述&使用&源码分析(持续更新)
2.onnxruntime源码学习-编译与调试 (公网&内网)
3.什么是类e类运行时runtime,软件报错microsoft visual c++ runtime library
4.如何编译 dotnet/runtime 源代码
5.《Android Runtime源码解析》介绍
6.openplc 研究:runtime层编译及运行,源码SCADABR试运行
ONNX-Runtime一本通:综述&使用&源码分析(持续更新)
ONNX-Runtime详解:架构概览、实践与源码解析
ONNX-Runtime作为异构模型运行框架,类e类其核心机制是源码先对原始ONNX模型进行硬件无关的图优化,之后根据支持的类e类硬件选择相应的算子库,将模型分解为子模型并发在各个平台执行。源码主机上运行源码它提供同步模式的类e类计算支持,暂不包括异步模式。源码ORT(onnx-runtime缩写)是类e类主要组件,包含了图优化(graph transformer)、源码执行提供者(EP)等关键模块。类e类
EP是源码执行提供者,它封装了硬件特有的类e类内存管理和算子库,可能只支持部分ONNX算子,源码但ORT的类e类CPU默认支持所有。ORT统一定义了tensor,但EP可有自定义,需提供转换接口。每个推理会话的run接口支持多线程,要求kernel的compute函数是并发友好的。
ORT具有后向兼容性,能运行旧版本ONNX模型,并支持跨平台运行,包括Windows、Linux、macOS、iOS和Android。安装和性能优化是实际应用中的重要步骤。
源码分析深入到ORT的核心模块,如框架(内存管理、tensor定义等)、图结构(构建、排序与修改)、优化器(包括RewriteRule和GraphTransformer),以及平台相关的功能如线程管理、文件操作等。Session是推理流程的管理核心,构造函数初始化模型和线程池,load负责模型反序列化,initialize则进行图优化和准备工作。
ORT中的源码等保认证执行提供者(EP)包括自定义实现和第三方库支持,如TensorRT、CoreML和SNPE。其中,ORT与CoreML和TensorRT的集成通过在线编译,将ONNX模型传递给这些框架进行计算。ORT通过统一的接口管理元框架之上的算子库,但是否支持异构运算(如SNPE与CPU库的混合)仍有待探讨。
总结来说,ONNX-Runtime处理多种模型格式,包括原始ONNX和优化过的ORT模型,以适应多平台和多设备需求。它通过复杂的架构和优化技术,构建了可扩展且高效的推理软件栈,展示了flatbuffer在性能和体积方面的优势。
附录:深入探讨ORT源码编译过程的细节。
onnxruntime源码学习-编译与调试 (公网&内网)
在深入学习ONNX Runtime的过程中,我决定从1.版本开始,以对比与理解多卡并行技术。为此,我选择了通过`./tools/ci_build/build.py`脚本进行编译,而不是直接执行`build.sh`,因为后者并不直接提供所需的参数。在`build.py:::parse_arguments()`函数中,我找到了可选择的参数,例如运行硬件(CPU/GPU)、调试模式(Debug/Release)以及是否并行编译。我特别使用了`--skip_submodule_sync`,以避免因与公网不通而手动下载“submodule”,即`./cmake/external`文件夹下的依赖组件。这样可以节省每次编译时检查依赖组件更新的时间,提高编译效率。同时,我使用`which nvcc`命令来确定`cuda_home`和`cudnn_home`的值。
我的编译环境配置为gcc8.5.0、cuda.7和cmake3..1,其中cmake版本需要不低于3.,gcc版本则至少为7.0,否则编译过程中会出现错误。在编译环境的配置中,可以通过设置PATH和LD_LIBRARY_PATH来指定可执行程序和动态库的intellij导入源码乱码路径。对于手动下载“submodule”的不便,可以通过先在公网编译cpu版本,然后在编译开始阶段由构建脚本自动下载所有依赖组件并拷贝至所需目录来简化流程。
编译顺利完成后,生成的so文件并未自动放入bin目录,这可能是由于在安装步骤后bin目录下才会出现相应的文件。接下来,我进入了调试阶段,使用vscode进行调试,最终成功运行了`build/RelWithDebInfo/onnxruntime_shared_lib_test`可执行文件。
在深入研究ONNX Runtime的编译流程时,我发现了一个更深入的资源,它涵盖了从`build.sh`到`build.py`再到`CmakeList.txt`的编译过程,以及上述流程中涉及的脚本解析。对这个流程感兴趣的读者可以进行更深入的研究。
在编译过程中,我遇到了一些问题,如下载cudnn并进行安装,以及解决找不到`stdlib.h`的问题。对于找不到`stdlib.h`,我通过查阅相关文章和理解编译过程中搜索路径的逻辑,最终找到了解决方案。如果忽略这个问题,我选择在另一台机器上重新编译以解决问题。
在使用vscode调试时,我遇到了崩溃问题,这可能是由于vscode、gdb或Debug模式编译出的可执行文件存在潜在问题。通过逐步排除,我最终确定问题可能出在Debug模式编译的可执行文件上。这一系列的探索和解决过程,不仅加深了我对ONNX Runtime的理解,也提高了我的调试和问题解决能力。
什么是运行时runtime,软件报错microsoft visual c++ runtime library
runtime在编程中指的是运行时环境,即程序执行所需的环境。runtime与执行时间紧密相关,但并非简单的“运行时”或“时运行”的合成词,中文理解为“执行准备环境”可能更贴切。 runtime库是网校商城系统源码在编译时构建,用于在程序运行期间实现语言内置功能,如输入输出、内存管理等。 C语言中的crt0是运行时库的最小组成部分,用于提供最基本的运行环境。crt0通常包含7个步骤,其结构在一些启动代码中常见,如u-boot源码。 crt0.S编译生成crt0.o文件,这是所有gcc编译应用程序的前序代码。类似的crt前缀文件如crt1.o等共同构成了runtime库。 运行时库与标准库不同。标准库定义了可用功能,但不构成编程语言规范的一部分。运行时库是程序执行必不可少的部分,如printf()函数,这部分代码在启动过程执行,对程序员不可见。 在操作系统中,不使用标准库的应用程序几乎无实际意义,因为它们无法访问外设或在屏幕上输出信息。但在裸机环境下,访问外设不需要系统调用,可以不依赖标准库。 简单编写一个只包含main函数的程序,编译后查看符号表,会发现许多函数符号源自crt*.o文件。 更多关于runtime的信息和相关概念,可以参考: 运行时相关问答:runtime stackoverflow链接 运行时库相关词条:运行时库维基百科链接 C运行初始化:运行时初始化embecosm链接 运行时库与标准库相关问答:运行时库与标准库问答链接如何编译 dotnet/runtime 源代码
编译 dotnet/runtime 源代码,首先需要环境准备,参考官方文档《在Windows上构建dotnet/runtime的要求》。我的机器仅提前安装了 Visual Studio ,确保按需自行安装。
初次尝试在命令行窗口进入代码所在目录,输入编译命令时,遇到的第一个问题是缺少 Python 3。安装 Python 3 后,发现新问题,下载文件任务中下载地址参数无法识别。查阅 dotnet/runtime 的传奇引擎 源码 原理 issue,找到解决方案,其中发帖者也是中国人,解答了这一疑惑。
为了找到编译过程中的所有错误,运行命令生成日志。使用“MSBuild Structured Log Viewer”打开日志文件,能够清晰地查看到具体的下载地址。按照日志中的提示,下载文件,复制到指定位置解压,成功解决了下载错误。随后,再次编译,直至提示编译成功。
然而,运行 dotnet/runtime 自带的测试用例时,发现找不到指定 dll,进一步发现对应的 dll 已经编译,但默认编译的是 net7.0-Debug 版本,而需要的是 net-Debug。通过使用 build.cmd -h 查看,发现可以指定编译框架版本。因此,再次编译,指定正确的框架版本,最终运行测试成功。
总结,编译 dotnet/runtime 源代码过程中遇到的主要问题,主要是由于访问国外的网速较慢导致的下载问题。通过生成日志、使用“MSBuild Structured Log Viewer”查看下载地址,以及正确指定编译框架版本等方法,成功解决了编译和运行过程中遇到的问题。
《Android Runtime源码解析》介绍
《Android Runtime源码解析》是我创作的第二本技术专著,于6月底完成印刷,现已在各大电商平台上市。借此机会,我简要介绍本书内容,以便对此感兴趣的朋友能有所了解。
本书以Android .0.0_r源码为基础,从编译器开发者的视角,分析了ART的各个部分及其主要流程,旨在向读者展示ART的基本框架。由于ART发展至今,规模庞大,复杂度较高,很多细节无法完全覆盖。因此,本书选择基本框架进行介绍,以便读者根据个人兴趣深入挖掘感兴趣的细节。
全书内容分为四个部分。第一部分包括第一章,主要介绍ART的基础知识;第二部分包括第二章至第四章,主要介绍ART中的编译器部分,包括dex2oat工具,这部分属于编译时阶段;第三部分包括第五章和第六章,主要介绍ART的启动和运行,属于运行时阶段;第四部分包括第七章,主要介绍ART中的垃圾回收部分。读者可以按照顺序阅读,也可以根据自己的需要选择阅读相关部分,不影响对内容的理解。
各章内容如下:第一章,从虚拟机基础、ART发展历史、ART核心架构和源码目录结构等方面对ART基础进行了介绍;第二章,介绍了dex2oat工具的入口、driver以及DexToDexCompiler等;第三章,分析了OptimizingCompiler中的JNI处理和Compile过程,并对Compile过程中的主要环节进行了详细阐述;第四章,介绍了OptimizingCompiler中硬件平台无关和硬件平台相关的优化,并深入分析了硬件平台无关优化中的典型优化;第五章,分析了ART在启动时的几个主要流程;第六章,分析了ART在执行时的主要流程;第七章,分析了ART GC的整体架构、种类及具体实现。
本书适合新入行的ART开发者以及想了解ART基本情况的各类开发者。
由于作者水平有限,本书中可能存在诸多问题,敬请各位专家批评指正。
openplc 研究:runtime层编译及运行,SCADABR试运行
在虚拟机环境搭建OpenPLC的runtime层,首先,选择使用本地虚拟机进行运行,便于在没有硬件设备的情况下进行测试。
下载代码资源,将OpenPLC的代码从Gitee平台获取,以方便在本地进行操作。使用Gitee平台提供的一键下载功能,轻松获取所需代码。
在虚拟机中进行代码的编译和安装,过程中可能会遇到网络速度较慢的情况,考虑使用清华镜像或其他加速工具以提高下载效率。运行后,通过访问localhost:,即可看到已经运行的OpenPLC系统,使用默认账号密码openplc进行登录。
运行默认程序,系统中预设了空白程序blank_program.st,点击左下角的运行按钮,程序将被启动执行。对于需要上传部署新程序的情况,需要将梯形图程序编译后生成的.st文件手动复制到OpenPLC runtime设备上,再通过启动对应程序并执行运行操作。在梯形图中虽有包含IO的blink功能,但实际运行状态需进一步确认。
启用EtherCAT功能,从GitHub源码库下载OpenPLC代码,使用git命令自动集成EtherCAT代码,随后对EtherCAT进行编译和安装。修改配置文件/etc/sysconfig/ethercat,注意路径应正确为/etc/ethercat.conf,配置文件只需设置MASTER0的MAC地址以及genric的module名称,其余无需填写。启动命令为指定的EtherCAT启动命令。
对于固定系统内核以防止自动更新的需求,根据具体情况进行操作,确保系统稳定运行。
关于SCADABR模块,国内用户可能面临下载困难的情况,建议通过Gitee或其他本地镜像平台同步代码资源。进行安装并运行,使用默认账号密码admin登录。基于Tomcat的SCADA系统,性能和功能可能较为传统,考虑寻找其他开源免费的SCADA软件进行比较和选择,以满足实际需求。
CRuntimeClass生成类
CRuntimeClass的CreateObject()函数能够动态创建一个类的对象,其功能类似于new关键字,但在某些特定情况下表现出独特的优势。下面通过一个实例来帮助理解。 假设我们有以下类的定义:cpp
class CWndA : public CWnd
class CWndB : public CWnd
在函数function1()中,我们有这样一段代码:cpp
function1()
{
CRuntimeClass* pC = RUNTIME_CLASS(CWndA);
CWnd* result = CreateWnd(pC);
}
函数CreateWnd接受一个CRuntimeClass*参数,其内部实现如下:cpp
CWnd* CreateWnd(CRuntimeClass* pClass)
{
return static_cast(pClass->CreateObject());
}
在这个例子中,CreateWnd返回的是CWnd类型的指针,但实际上它是一个CWndA类型的指针。通过这种方式,你可以从子类指针强制转换为父类指针,无需担心类型转换错误。CRuntimeClass的使用简化了使用switch语句根据不同类创建实例的复杂过程。 值得注意的是,为了使用CreateObject()的特性,类的定义中需要包含IMPLEMENT_DYNCREATE宏。当你深入理解了这一点并体验到它带来的便利时,你可能会对Microsoft(M$)如何通过宏实现类的动态检测感到惊叹。如果你想深入了解,不妨研究一下MFC(Microsoft Foundation Classes)的源代码。扩展资料
CRuntimeClass没有基类。 每个由CObject派生的类都与一个CRuntimeClass结构相联系,用户可以使用该结构获取一个对象及其基类的运行时信息。当需要额外的函数参数检查时,或当用户必须根据一个对象的类编写特殊目的代码时,在运行时确定该对象的类就非常有用。C++并不直接支持运行时类的信息。UE4 LevelSequence源码剖析(一)
UE4的LevelSequence源码解析系列将分四部分探讨,本篇聚焦Runtime部分。Runtime代码主要位于UnrealEngine\Engine\Source\Runtime\MovieScene目录,结构上主要包括Channels、Evaluation、Sections和Tracks等核心模块。
ALevelSequenceActor是Runtime的核心,负责逐帧更新,它包含UMovieSceneSequence和ULevelSequencePlayer。ALevelSequenceActor独立于GameThread更新,并且在Actor和ActorComponent更新之前,确保其在RuntTickGroup之前执行。
IMovieScenePlaybackClient的关键接口用于绑定,编辑器通过IMovieSceneBindingOwnerInterface提供直观的蓝图绑定机制。UMovieSceneSequence是LevelSequence资源实例,它支持SpawnableObject和PossessableObject,便于控制对象的拥有和分离。
ULevelSequencePlayer作为播放控制器,由ALevelSequenceActor的Tick更新,具有指定对象在World和Sublevel中的功能,还包含用于时间控制的FMovieSceneTimeController。UMovieSceneTrack作为底层架构,由UMovieSceneSections组成,每个Section封装了Section的帧范围和对应Channel的数据。
序列的Eval过程涉及EvalTemplate和ExecutionTokens,它们协同工作模拟Track。FMovieSceneEvaluationTemplate定义了Track的模拟行为,而ExecutionTokens则是模拟过程中的最小单元。真正的模拟操作在FMovieSceneExecutionTokens的Apply函数中执行,通过BlendingAccumulator进行结果融合。
自定义UMovieSceneTrack需要定义自己的EvaluationTemplate,这部分将在编辑器拓展部分详细讲解。序列的Runtime部分展示了如何在GameThread中高效管理和模拟场景变化,为后续的解析奠定了基础。
Addressables Runtime源码学习之总览
Addressables系统,一套封装了资源管理逻辑的系统,主要由Editor和Runtime两部分构成。其中,Editor负责资源的分组管理和打包,而Runtime则主要处理资源的内存管理。
本文将重点分析Runtime部分,首先从整体上对其进行概述。Runtime主要包括API、初始化、资源定位、资源加载和解析、资源管理以及多平台这些部分。这些分类主要是基于类的功能性进行总结的。
以下标题分类则是按照Runtime下代码的目录层级进行划分的。在ResourceManager目录下,包含ResourceProvider目录,其中Provider主要负责各种资源的加载和解析。此外,Manager目录下还包含Operations目录,Operations作为操作类,负责初始化、加载、卸载等操作。这里包含了Operations的基类以及ProviderOperation等。
APIAddressables是一个API的壳,主要包含以下几个成员:
其中,API的接口主要包括以下几种:
AddressablesImpl是关于Addressables接口的具体实现。
AssetLabelReference是Asset Label的引用类,实现了IKeyEvaluator接口。
RuntimeKey对应LabelString。
AssetReference是Addressable Asset的引用,同样实现了IKeyEvaluator接口。
RuntimeKey对应GUID。
包含资源加载和卸载的接口,最终会调用AddressableImpl的接口。
AssetReferenceUILabelRestriction用于限制AssetReference的Label。
IKeyEvaluator提供RuntimeKey的接口。
初始化、资源定位器ResourceLocators、资源管理ResourceManager、资源内容管理器ResourcesProviders、服务Services、公用Utility等模块在编辑中...