TWINE支持编译为wasm应用运行设计

提要
本期推送是对icde 2021 中发表的论文《twine:an embedded trusted runtime for webassembly》的解读。webassembly是一种越来越流行的轻量级二进制指令格式。这篇论文描述了twine,这是一个webassembly trusted runtime,它能够支持编译为wasm的应用运行。twine提供了一个安全的软件runtime(沙箱),它嵌入在tee中;并且提供wasi interface,通过wasi来抽象底层环境。twine会动态地将wasi操作翻译为等价的os calls和sgx中的安全的库。特别地,作者使用twine实现了一个安全、可信的sqlite版本,这是一个众所周知的成熟的可嵌入数据库。作者认为这样一个受信任的数据库将是构建许多大型应用程序服务的合理组件。评估表明,sqlite可以通过webassembly和现有的系统接口在sgx enclave内完全执行,平均性能开销类似。额外的安全保证及其与标准webassembly的完全兼容性在很大程度上弥补了性能上的损失。
研究背景
可信代码执行目前是分布式系统的主要挑战之一。无论是云中的大型数据中心,还是瘦客户机和物联网设备上的网络边缘,其中存储了许多的数据资产。这些数据是许多公司的关键资产。例如像intel sgx、arm trustzone等等这些tee环境(trusted execution environment,可信执行环境)就可以通过特殊的硬件结构为代码安全执行提供硬件支持,从而可以从外界环境中被保护出来,或者说隔离出来,这些外界环境包括操作系统和特权用户。
然而,尽管涌现出了许多framework和runtime environment,为tee编写应用程序仍然是一项复杂的任务。开发人员通常必须使用定制的工具和api,而且仅支持少数的编程语言。所以,作者提出了支持对unmodified applications执行的trusted runtime,这个runtime作为一个virtual machine运行在tee中,只需将application编译为webassembly,因为wasm是不限制语言的。因为wasm自身的一些优点,这个trusted runtime具有执行速度快、通用性好(支持多种语言开发的application)、安全(沙箱环境)等优势。
图1:研究背景示意图
系统设计
作者设计的trusted runtime是运行在tee中的。intel sgx 是在现代英特尔处理器中的一组处理器指令,程序员可以通过使用 sgx 创建内存的加密区域,称为enclaves。通过enclave内部的指令对其中内存内容进行读写操作时会自动加密和解密。enclave加密密钥保存在处理器内部,没有任何指令可以访问这些密钥,即使当运行高级硬件特权级别时,操作系统、虚拟机管理员也无法获取。enclave内的内存受到保护,不接受任何未经授权的访问,甚至不接受具有物理访问权限的机器管理员的访问。
图2:sgx工作示意图
对enclave中的内存访问通过一个大块的缓存来加速,这个cache memory被称为enclave page cache(epc)。epc的大小是受限的,在最新的cpu中支持最大为256mb的epc。处理器在 epc 中保存所有 enclave page 的未加密副本,并且当 epc 满的时候采用分页。并且硬件还为epc中的所有enclave page维护加密hash表。enclave内部的指令可以访问enclave外部的数据,但是调用enclave外部的指令需要一个特殊的out call指令(ocall)。当调用ocall时,cpu退出受保护的enclave,在外部执行代码。相反,有一个enclave call(ecall)指令来调用enclave内的代码。ocall和ecall指令会比较慢,因为在enclave内部和外部之间切换上下文的代价很高(在最新的服务器级处理器中,高达13’100个cpu周期)。已有的工作已经证明,在enclave中的应用程序应该尽量避免这样的调用,以减少性能损失。
作者提出了twine (trusted wasm in enclave),这是一个运行在tee中的轻量级可嵌入wasm虚拟机。图3中描述了twine的workflow。它充当应用程序与底层tee、os和硬件之间的适配层。twine提供了嵌套在tee中的安全软件运行时(沙箱),支持wasi接口,并从应用程序中抽象出底层环境。
图3:twine workflow
twine是一个适用于在tee中运行wasm应用程序的执行环境。它主要由两个主要模块构成: wasm runtime 和 wasi接口。wasm runtime 完全运行在tee内部,作者使用的tee是intel sgx。作者通过利用tee的保护来为运行wasm application提供一个可信环境。wasi充当受信任和不受信任环境之间的桥梁,抽象出专用于与底层操作系统通信的机制。因此,wasi相当于由ocalls组成的传统sgx适配层。wasi能够通过沙箱实现安全性。常规应用程序通常通过标准接口(例如posix)调用操作系统。wasi在wasm操作系统调用和实际的操作系统接口之间增加了一层(薄薄的)控制层。因此,runtime环境可以自己限制各个wasm程序所能做的事情,从而阻止wasm代码使用运行进程的用户的全部权限。(例如,wasi实现可以将应用程序限制在文件系统的子树中,这与chroot提供的功能类似。)在enclave中的代码和数据被认为是可信的,在此之外的进程部分、操作系统和(任何hypervisor)都可能是敌对的、恶意的。enclave内部的内存只能从外部以加密的形式读取。从外部写入enclave会导致enclave终止。
图4:twine 架构
通过wasi,能够实现三重抽象:
(1)开发人员可以自由选择编程语言,并通过compiler将它编译为wasm binaries。
这解除了sgx强加的限制,之前通常因为这个限制强制应用程序必须用c/c++编写。
(2)将tee从应用程序中抽象出来,只要tee能够解释或执行wasm (带有wasi支持),应用程序就可以安全执行。
这为其他tee技术打开了大门。
(3)wasi是与系统无关的,只要操作系统能够提供wasi所需的等效api。
由于wasi模拟posix系统的系统调用,许多unix变体都可以实现它。
图5:wasi的三层抽象
作者选择了一个已有的wasm runtime project-wamr来作为runtime,并修改了它的wasi接口。wamr支持解释器、jit、aot三种方式的wasm binaries执行。但是考虑到速度的问题,native code执行起来比解释器快。并且,解释器环境相对runtime而言,占用内存更大,这对于边缘计算又是很重要的。因此,作者放弃了wamr中interpreter的方式。又因为jit方式是运行时即时编译,需要在一个enclave中嵌进来一个jit compiler。所以就要在enclave中引入llvm machinery,这需要移植代码库来编译sgx的限制。所以最终作者采用了aot的方式。
wamr中原生的对wasi的实现,严重依赖于posix调用。posix在sgx enclave中不可用,因此wamr作者编写的wasi实现需要频繁地跨越enclave的可信边界,并使用ocalls直接将大多数wasi函数路由到它们的posix等效函数。出于性能原因:大多数wasi调用将被简单地转换为ocalls。其次,作者希望能够利用其可信实现,例如英特尔保护的文件系统(ipfs)。因此,作者重构了wamr的wasi实现,以保持其沙箱实施。
实验评估
如图6所示,作者使用 polybench/c benchmarks 来作为实验的benchmark,展示了30个polybench/c (v4.2.1-beta)测试的结果。通过native执行时间来进行标准化,比较了wamr for wasm和twine for wasm in tee的执行时间,结果如图所示。wasm应用程序通常比本机应用程序慢,由于
(1)寄存器压力增加
(2)更多的分支语句
(3)代码大小增加等等
但是wamr和twine之间的差距较小。
图6:polybench/c benchmark的性能测试,标准化到native speed
sqlite是一个被广泛使用的成熟的嵌入式数据库。由于其便携性(portability)和紧凑的尺寸(compact size),它非常适合sgx。并且sqlite能够体现出性能密集型的操作和文件系统交互,所以作者也对它进行了评估。作者使用了sqlite自己的性能测试程序speedtest1,运行了32个可用测试中的29个,覆盖了大量场景。每个speedtest1实验都针对于数据库的一个方面,(例如,使用多个关节进行选择,更新索引记录,等等)。测试由任意数量的sql查询组成,根据生成的负载可能会执行多次。图7中显示了测试的结果,以native execution为标准进行了标准化。(其中包括内存中配置的结果,以及使用wasi的持久化数据库的结果。)作者在所有测试中观察到,对于in-memory数据库和in-file数据库,wamr相对于本地数据库平均慢4.1x和3.7×。
在in-memory和in-file数据库中,twine相对于wamr的速度慢了1.7x和1.9x。
图7:在sqlite speedtest1 benchmark上的相对性能
为了更好地理解所观察到的性能损失的来源,作者为常见的数据库查询设计了一套测试,包括插入、顺序读取和随机读取。根据对这三类操作的执行时间分析,得出以下结果:
(1)图8a显示了关于插入记录的结果。
由于额外的文件加密,使用twine的持久数据库的操作成本线性增加。
(sgx-lkl在插入顺序元素方面有更优的方法,并遵循了twine的内存性能趋势。)
(2)图8b显示了顺序读取所有记录的执行时间。
作者在sgx内存访问中发现了造成这种性能损失的根本原因。
(3)图8c描述了随机读取的执行时间。
随机读取更加经常地触发enclave分页机制,文件内随机读取的例子突出了twine的优点,它提供了比sgx-lkl更快的性能,epc(enclave page cache)限制之前为1.031×,之后为1.074×。在epc限制以上的内存内插入也会有类似的性能提升,增益为1.035×。
图8:对sqlite的插入和读取进行性能评估
结论
这篇论文设计并实现了twine以支持编译为wasm的应用运行。twine提供了一个安全的软件runtime(沙箱),它嵌入在tee中;并且提供wasi interface,通过wasi来抽象底层环境。评估表明,sqlite可以通过webassembly和现有的系统接口在sgx enclave内完全执行,并且平均性能开销类似。
原文标题:思辨|webassembly的嵌入式可信运行时
文章出处:【微信公众号:linux阅码场】欢迎添加关注!文章转载请注明出处。


什么是电子纸
华为首款电视产品以荣耀品牌推出,为55英寸
三星已决定不在美国销售Galaxy Fold 5G?
日本为了让人们了解如何应对地震而发布了VR地震体验车
开源硬件大赛正式展开,细数十大获奖作品
TWINE支持编译为wasm应用运行设计
全国产化两线制/三线制电流环发送器系列产品应用指南
采用风河VxWorks商用平台,西门子工业计算机加快上市速度
怎样成为一名自由的程序员
德州仪器携手特来电打造更加高效的电动汽车充电网
电脑监控软件,做到实时监管
吸尘拖地两用 扫拖一体机会是扫地机器人发展方向么?
MOSFET选型注意事项及应用实例
雷曼LEDHUB为深圳人才宣传提供新窗口
数控机床对刀的目的及方法
RV功率监视器的制作
TCP/IP网络系统中卫星链路模拟器的设计
疑是有害硫氯溴化物确诊失效分析
企业供应链系统管理的原理及特征的介绍
一起来了解1.72/Rt*Ct 和 1.8/Rt*Ct