问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

Flutter浪潮下的音视频研发探索

发布网友 发布时间:2022-10-15 17:55

我来回答

1个回答

热心网友 时间:2023-10-10 12:08

文/陈炉军

整理/LiveVideoStack

大家好,我是阿里巴巴闲鱼事业部的陈炉军,本次分享的主题是Flutter浪潮下的音视频研发探索,主要内容是针对闲鱼APP在当下流行的跨平台框架Flutter的大规模实践,介绍其在音视频领域碰到的一些困难以及解决方案。

分享内容主要分为四个方面,首先会对Flutter有一个简单介绍以及选择Flutter作为跨平台框架的原因,其次会介绍Flutter中与音视频关系非常大的外接纹理概念,以及对它做出的一些优化。之后会对闲鱼在音视频实践过程中碰到的一些Flutter问题提出了一些解决方案——TPM音视频框架。最后是闲鱼Flutter多媒体开源组件的介绍。

Flutter

Flutter是一个跨平台框架,以往的做法是将音频、视频和网络这些模块都下沉到C++层或者ARM层,在其上封装成一个音视频的SDK,供UI层的PC、iOS和Android调用。

而Flutter做为一个UI层的跨平台框架,顾名思义就是在UI层也实现了一个跨平台开发。可以预想的是未Flutter发展的好的话,会逐渐变为一个从底层到UI层的一个全链路的跨平台开发,技术人员分别负责SDK和UI层的开发。

在Flutter之前已经有很多跨平台UI解决方案,那为什么选择Flutter呢?

我们主要考虑性能和跨平台的能力。

以往的跨平台方案比如Weex,ReactNative,Cordova等等因为架构的原因无法满足性能要求,尤其是在音视频这种性能要求几乎苛刻的场景。

而诸如Xamarin等,虽然性能可以和原生App一致,但是大部分逻辑还是需要分平台实现。

我们可以看一下,为什么Flutter可以实现高性能:

原生的native组件渲染以IOS为例,苹果的UIKit通过调用平台自己的绘制框架QuaztCore来实现UI的绘制,图形绘制也是调用底层的API,比如OpenGL、Metal等。

而Flutter也是和原生API逻辑一致,也是通过调用底层的绘制框架层SKIA实现UI层。这样相当于Flutter他自己实现了一套UI框架,提供了一种性能超越原生API的跨平台可能性。

但是我们说一个框架最终性能怎样,其实取决于设计者和开发者。至于现在到底是一个什么状况:

在闲鱼的实践中,我们发现在正常的开发没有特意的去优化UI代码的情况下,在一些低端机上,Flutter界面的流畅性是比Native界面要好的。

虽然现在闲鱼某些场景下会有卡顿闪退等情况,但是这是一个新事物发展过程中的必然问题,我们相信未来性能肯定不会成为*Flutter发展的瓶颈的。

在闲鱼实践Flutter的过程中,混合栈和音视频是其中比较难解决的两个问题,混合栈是指一个APP在Flutter过程中不可能一口气将所有业务全部重写为Flutter,所以这是一个逐步迭代的过程,这期间原生native界面与Flutter界面共存的状态就称之为混合栈。闲鱼在混合栈上也有一些比较好的输出,例如FlutterBoost。

外接纹理

在讲音视频之前需要简要介绍一下外接纹理的概念,我们将它称之为是Flutter和Frame之间的桥梁。

Flutter渲染一帧屏幕数据首先要做的是,GPU发出的VC信号在Flutter的UI线程,通过AOT编译的机器码结合当前Dart Runtime,生成Layer Tree UI树,Layer Tree上每一个叶子节点都代表了当前屏幕上所需要渲染的每一个元素,包含了这些元素渲染所需要的内容。将Layer Tree抛给GPU线程,在GPU线程内调用Skia去完成整个UI的渲染过程。Layer Tree中有PictureLayer和TextureLayer两个比较重要的节点。PictureLayer主要负责屏幕图片的渲染,Flutter内部实现了一套图片解码逻辑,在IO线程将图片读取或者从网络上拉取之后,通过解码能够在IO线程上加载出纹理,交给GPU线程将图片渲染到屏幕上。但是由于音视频场景下系统API太过繁多,业务场景过于复杂。Flutter没有一套逻辑去实现跨平台的音视频组件,所以说Flutter提出了一种让第三方开发者来实现音视频组件的方式,而这些音视频组件的视频渲染出口,就是TextureLayer。

在整个Layer Tree渲染的过程中,TextureLayer的数据纹理需要由外部第三方开发者来指定,可以把视频数据和播放器数据送到TextureLayer里,由Flutter将这些数据渲染出来。

TextureLayer渲染过程:首先判断Layer是否已经初始化,如果没有就创建一个Texture,然后将Texture Attach到一个SufaceTexture上。

这个SufaceTexture是音视频的native代码可以获取到的对象,通过这个对象创建的Suface,我们可以将视频数据、摄像头数据解码放到Suface中,然后Flutter端通过监听SufaceTexture的数据更新就可以顺利把刚才创建的数据更新到它的纹理中,然后再将纹理交给SKIA渲染到屏幕上。

然而我们如果需要用Flutter实现美颜,滤镜,人脸贴图等等功能,就需要将视频数据读取出来,更新到纹理中,再将GPU纹理经过美颜滤镜处理后生成一个处理后的纹理。按Flutter提供的现有能力,必须先将纹理中的数据从GPU读出到CPU中,生成Bitmap后再写入Surface中,这样在Flutter中才能顺利的更新到视频数据,这样做对系统性能的消耗很大。

通过对Flutter渲染过程分析,我们知道Flutter底层需要渲染的数据就是GPU纹理,而我们经过美颜滤镜处理完成以后的结果也是GPU纹理,如果可以将它直接交给Flutter渲染,那就可以避免GPU->CPU->GPU这样的无用循环。这样的方法是可行的,但是需要一个条件,就是OpenGL上下文共享。

OpenGL

在说上下文之前,得提到一个和上线文息息相关的概念:线程。

Flutter引擎启动后会启动四个线程:

第一个线程是UI线程,这是Flutter自己定义的UI线程,主要负责GPU发出的VSync信号时候用当前Dart编译的机器码和当前运行环境创建出Layer Tree。

还有就是IO线程和GPU线程。和大部分OpenGL处理解决方案中一样,Flutter也采取一个线程责资源加载,一部分负责资源渲染这种思路。

两个线程之间纹理共享有两种方式。一种是EGLImage(IOS是 CVOpenGLESTextureCache)。一种是OpenGL Share Context。Flutter通过Share Context来实现纹理共享,将IO线程的Context和GPU线程的Context进行Share,放到同一个Share Group下面,这样两个线程下资源是互相可见可以共享的。

Platform线程是主线程,Flutter中有一个很奇怪的设定,GPU线程和主线程共用一个Context。并且在主线程也有很多OpenGL 操作。

这样的设计会给音视频开发带来很多问题,后面会详细说。

音视频端美颜处理完成的OpenGL纹理能够让Flutter直接使用的条件就是Flutter的上下文需要和平台音视频相关的OpenGL上下文处在一个Share Group下面。

由于Flutter主线程的Context就是GPU的Context,所以在音视频端主线程中有一些OpenGL操作的话,很有可能使Flutter整个OpenGL被破坏掉。所以需要将所有的OpenGL操作都*在子线程中。

通过上述这两个条件的处理,我们就可以在没有增加GPU消耗的前提下实现美颜和滤镜等等功能。

TPM

在经过demo验证之后,我们将这个方案应用到闲鱼音视频组件中,但改造过程中发现了一些问题。

上图是摄像头采集数据转换为纹理的一段代码,其中有两个操作:首先是切进程,将后面的OpenGL操作都切到cameraQueue中。然后是设置一次上下文。然后这种*条件或者说是潜规则往往在开发过程中容易被忽略的。而这个条件一旦忽略后果就是出现一些莫名其妙的诡异问题极难排查。因此我们就希望能抽象出一套框架,由框架本身实现线程的切换、上下文和模块生命周期等的管理,开发者接入框架以后只需要安心实现自己的算法,而不需要关心这些潜规则还有其他一些重复的逻辑操作。

在引入Flutter之前闲鱼的音视频架构与大部分音视频逻辑一样采用分层架构:

1:底层是一些独立模块

2:SDK层是对底层模块的封装

3:最上层是UI层。

引入Flutter之后,通过分析各个模块的使用场景,我们可以得出一个假设或者说是抽象:音视频应用在终端上可以归纳为视频帧解码之后视频数据帧在各个模块之间流动的过程,基于这种假设去做Flutter音视频框架的抽象。

咸鱼Flutter多媒体开源组件

整个Flutter音视频框架抽象分为管线和数据的抽象、模块的抽象、线程统一管理和上下文同一管理四部分。

管线,其实就是视频帧流动的管道。数据,音视频中涉及到的数据包括纹理、Bit Map以及时间戳等。结合现有的应用场景我们定义了管线流通数据以Texture为主数据,同时可以选择性的添加Bit Map等作为辅助数据。这样的数据定义方式,避免重复的创建和销毁纹理带来的性能开销以及多线程访问纹理带来的一些问题。也满足一些特殊模块对特殊数据的需求。同时也设计了纹理池来管理管线中的纹理数据。

模块:如果把管线和数据比喻成血管和血液,那框架音视频的场景就可以比喻成器官,我们根据模块所在管线的位置抽象出采集、处理和输出三个基类。这三个基类里实现了刚才说的线程切换,上下文切换,格式转换等等共同逻辑,各个功能模块通过集成自这些基类,可以避免很多重复劳动。

线程:每一个模块初始化的时候,初始化函数就会去线程管理的模块去获取自己的线程,线程管理模块可以决定给初始化函数分配新的线程或者已经分配过其他模块的线程。

这样有三个好处:

一是可以根据需要去决定一个线程可以挂载多少模块,做到线程间的负载均衡。第二,多线程并发式能够保证模块内的OpenGL操作是在当前线程内而不会跑到主线程去,彻底避免Flutter的OpenGL 环境被破坏。第三,多线程并行可以充分利用CPU多核架构,提升处理速度。

从Flutter端修改Flutter引擎将Context取出后,根据Context创建上下文的统一管理模块,每一个模块在初始化的时候会获取它的线程,获取之后会调用上下文管理模块获取自己的上下文。这样可以保证每一个模块的上下文都是与Flutter的上下文进行Share的,每个模块之间资源都是共享可见的,Flutter和音视频native之间也是互相共享可见的。

基于上述框架如果要实现一个简单的场景,比如画面实时预览和滤镜处理功能,

1:需要选择功能模块,功能模块包括摄像头模块、滤镜处理模块和Flutter画面渲染模块,

2:需要配置模块参数,比如采集分辨率、滤镜参数和前后摄像头设置等,

3:在创建视频管线后使用已配置的参数创建模块

4:最后管线搭载模块,开启管线就可以实现这样简单的功能。

上图为整个功能实现的代码和结构图。

结合上述音视频框架,闲鱼实现了Flutter多媒体开源组件。

组要包含四个基本组件分别是:

1:视频图像拍摄组件

2:播放器组件

3:视频图像编辑组件

4:相册选择组件

现在这些组件正在走内部开源流程。预计9月份,相册和播放器会实现开源。

后续展望和规划

1:实现开头所说的从底层SDK到UI的全链路的跨端开发。目前底层框架层和模块层都是各个平台各自实现,反而是Flutter的UI端进行了跨平台的统一,所以后续会将底层也按照音视频常用做法把逻辑下沉到C++层,尽可能的实现全链路跨平台。

2:第二部分内容为开源共建,闲鱼开源的内容不仅包括拍摄、编辑组件,还包括了很多底层模块,希望有开发者在基于Flutter开发音视频应用时可以充分利用闲鱼开源出的音视频模块能力,搭建APP框架,开发者只要去负责实现特殊需求模块就可以,尽可能的减少重复劳动。
Flutter浪潮下的音视频研发探索

大家好,我是阿里巴巴闲鱼事业部的陈炉军,本次分享的主题是Flutter浪潮下的音视频研发探索,主要内容是针对闲鱼APP在当下流行的跨平台框架Flutter的大规模实践,介绍其在音视频领域碰到的一些困难以及解决方案。分享内容主要分为四个方面,首先会对Flutter有一个简单介绍以及选择Flutter作为跨平台框架的原因,其次会介绍Flutter中...

flutter webrtc实现音视频难不难?

flutter webrtc实现音视频其实不难,你可以试试接入ZEGO即构科技的音视频sdk,他们支持1V1或32人以上的多人视频聊天互动、在线教育等场景,多终端兼容,网上可以学习到的,超清音画质多人通话流畅不掉线,即构科技优秀的全球网络调度策略,满足200+国家/地区低延迟视频互动,技术和声誉都很好的。

Flutter 音视频处理FFmpeg

https://pub.flutter-io.cn/packages/flutter_ffmpeg ffmpeg 插件,文档没给出如何给视频添加水印, 但是给出了执行命令的方法演示, 这就足够了。添加一个水印:String command = "-i " + inputVideoPath + " -i "+waterMarkPath+" -filter_complex overlay "+ outVideoPath+"";添加多个水印命令...

做混合的话Uniapp和Flutter我应该学哪个啊?

彼时闲鱼FlutterIM架构升级根本目的从来不是因Flutter而Flutter,是由于历史包袱的繁重,代码层面的维护成本高,新业务的扩展性差,人力配比不协调以及疑难杂症的舆情持续反馈等等因素造成我们不得不去探索新方案。 经过闲鱼IM超复杂业务场景验证Flutter模式的逻辑跨端可行性,闲鱼在Flutter路上会一直保持前沿探索,最后能反馈到...

Flutter开发--视频播放器

1、fijkplayer 是一个 Flutter 生态的媒体播放器,是对 ijkplayer 的 Flutter 封装,支持 Android 和 iOS。 fijkplayer 使用 ijkplayer 作为播放器内核,ijkplayer 使用 ffmpeg 进行音视频解封装和解码,同时添加了 Android 和 iOS 平台特有的硬件加速解码能力。2 、国内有QQ群,但是活跃度也是不高。3、...

2023年,移动端应用开发的出路是什么?

Android技术提升的路径并非单一,包括但不限于应用开发、系统开发、音视频处理、Flutter开发等多元化方向。为了成为专家,建议按照一个全面的学习路线图,结合Android Studio资源、视频教程、实战案例、经典书籍阅读以及面试准备。记住,成功的关键在于持续学习和实践,以及对行业动态的敏感度。二八定律告诉我们,...

除了融云的音视频sdk比较好用以外,还有哪家厂商推荐?

目前主流的直播平台、教育、远程医疗等行业都有用到直播/CDN加速等应用技术,声网、即构和亮眼云SDK都提供了各种直播互动功能。声网、野狗云、即构提供了单独的直播SDK包,亮眼云和天翼RTC是将视频通话、视频会议和直播融合在一个SDK。实测在互联网320x240单播模式较为流畅清晰,连麦方式下多个主播时卡顿...

客户端开发还有出路吗?

从学习成本和市场需求的角度来看,对于有志于此的人来说,可以考虑从iOS/Android客户端开发起步,转向直播或短视频业务,然后深入音视频底层SDK开发,以此提升技能并解决实际问题(见下表)。当然,选择路径时,个人的兴趣和专业背景也应纳入考虑。总结来说,客户端开发虽然面临挑战,但通过适应市场需求、...

app开发一般分为哪几个等级?

按复杂程度可以分为三个等级:1、简单的app开发—web语言 HTML5是构建Web内容的一种语言描述方式。HTML5是Web中核心语言HTML的规范。编程语言就是网页三件套HTML+CSS+Javascript。这种方式实现实现app开发比较容易,而且还是跨平台开发,只要开发一套代码,就可以适用于安卓,苹果等多个操作系统,但是这种方式...

...Flutter 最全开源项目(UI、导航、网络、音视频...

Flutter,Google的跨平台UI框架,因其快速开发和广泛应用而备受开发者青睐。据统计,截至2019年,它已收获超过8万关注,是前端技术的热门之选。为了提升开发效率,Flutter开发者广泛依赖开源社区库。以下是Flutter开发中常用的开源项目总结,不分先后:UI展示:flutter_html_view和flutter_html_textview用于HTML...

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
如何召唤出LOL末日仪式的提莫大魔王? 无偏无陂基本信息 请问"无偏无陂,遵王之义"是什么意思? ...显示的就是成功保存到相册 为什么在相册找不到 求大神解答 通过百格系统发布的活动,可以在手机端报名吗? 参会者通过百格活动报名成功默认的通知方式是邮件,如何改成短信... ...学术方面的会议,有没有可以快速安排好日程的活动平台推荐? ...发现主办方信息填错了,有什么办法可以修改吗? ...我的身份证电子版就是扫描件,我如何在扫描件上做什么措施以防止除此... 怎样在身份证上加字 因为我要通过网上传给别人 又怕别人利用所以想加字... 请教高手这是什么石头?值钱吗? 阿富汗蓝玉值钱吗 江苏洋河今世玉液蓝玉浓香型白酒42度净含量480ml多少钱一瓶 高中对数函数题 高中对数函数题目,求解!!! 高中对数函数的题 小弟弟要多长才算及格? 在《赵氏孤儿》中,“韩厥”是谁? 《赵氏孤儿》的作者是怎么写韩厥这个人物的? 历史上赵氏孤儿案韩厥是个怎样的人 潜滋暗长是褒义词还是贬义词 彭浦新村到龙山新村有多远 火蓝刀锋25集赵子武为什么打响廖勇的信号枪 上海市静安区高平路88号+是哪个街道的? 上海市静安区彭浦镇属于高平路811号属于什么风险? 上海市静安区永和路598号属于哪个乡镇? 沪太路1170弄45号103室属于什么居委会管辖? 上海市静安区老沪太路1233号属于哪个街道办事处? 霹雳枪界五大顶峰是那五个人 内蒙古鄂尔多斯地区 环境适合种植什么类型的树木? 蓝玉白玉青玉白玉哪种狱更值钱点??? 阿里山印象,滕王阁蓝玉,长白山(10多块钱的),这三种烟哪种最好抽? 我家有七棵蓝玉石是两百多年前的值多少钱 为什么谷歌放弃了flutter 各位懂玉的大神帮忙看看,这3条是且末蓝吗?哪的料,多少钱合适入手?拜谢 三倍的o2相对分子质量是多少 3O2计算相对分子质量 四年级下册观察土壤结论怎么写? 观察物体评课优缺点 用加热氯化钾与少量二氧化锰混合物的方法 制取氧气9.6g 求被分解的氯化钾的质量 土壤观察 浦潍大楼怎么样?好不好?值不值得买? O2和O3等质量相同状态*积比和密度比? 同温下等体积质量比?分子数比?原子数比? 上海汔车南站离崂山路有多少公里 上海佘山到浦东崂山路的地铁路线 上海南站至崂山路707号怎么走? 从北桥骑动车到崂山路怎么走 那位知道浙江有学印刷刻版的学校 上海南泉大酒店的周边简介 郴州至潍坊高铁几小时到站