问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

AI系统架构之算法平台设计

发布网友 发布时间:2022-11-17 02:53

我来回答

1个回答

热心网友 时间:2024-09-20 18:47

明确需求之后,算法平台的设计就比较明确了,业界可以参考的例子包括*的fblearner和Uber的Michelangelo(如下图)。

可以看到,算法平台包含几个环节:

* 数据准备

主要是如何准备数据,并且管理数据在离线、近线和在线模式之间的分布。

* 模型训练和评估

主要是使用各种基础平台(Spark/Tensorflow/Xgboost等)训练模型,从数据中获取可以应用的模型和规则。

训练出来的模型,需要进行验证和评估,评估包括在训练集、测试集和时间外验证集上的表现,检查模型的性能表现(KS、AUC等)、拟合程度和时间衰减。

* 模型服务与业务整合

在离线选择好模型之后,就可以把它放到线上做实际的应用了,在真实系统中验证假设是否成立。

落地路径:线上系统-》到训练平台

在充满遗留系统的老企业或者人力不足的新企业,往往需要从线上系统开始。对于训练过程,经常看到成立几年的数据团队,还在使用单机电脑训练模型,在数据量不大的场景,半人肉的训练短期是可以接受的,考虑到单机版的sklearn、keras这么流行,也可以理解这一点。

从收益角度来看,AI系统的最大价值体现在与业务结合的部分,例如促进增长、降低成本等,其次才是对人效的提升,例如自动运营、自动训练。看清楚这一点,也就认同了从线上到线下的落地路径。

线上系统设计

线上系统包含两个部分,一部分负责模型打分,也就是inference,另外一部分是策略,以及与业务系统对接。

inference部分面临的问题,是如何支持各种不同的建模工具,例如sas、python、spark等等,如果对性能并发要求不高,就可以使用pmml的对应语言实现,快速上线获取短期胜利。

策略部分,一般可以映射成规则,使用drools这样的规则引擎实现,可以解决最初一段时间的绝大部分需求。

热心网友 时间:2024-09-20 18:47

明确需求之后,算法平台的设计就比较明确了,业界可以参考的例子包括*的fblearner和Uber的Michelangelo(如下图)。

可以看到,算法平台包含几个环节:

* 数据准备

主要是如何准备数据,并且管理数据在离线、近线和在线模式之间的分布。

* 模型训练和评估

主要是使用各种基础平台(Spark/Tensorflow/Xgboost等)训练模型,从数据中获取可以应用的模型和规则。

训练出来的模型,需要进行验证和评估,评估包括在训练集、测试集和时间外验证集上的表现,检查模型的性能表现(KS、AUC等)、拟合程度和时间衰减。

* 模型服务与业务整合

在离线选择好模型之后,就可以把它放到线上做实际的应用了,在真实系统中验证假设是否成立。

落地路径:线上系统-》到训练平台

在充满遗留系统的老企业或者人力不足的新企业,往往需要从线上系统开始。对于训练过程,经常看到成立几年的数据团队,还在使用单机电脑训练模型,在数据量不大的场景,半人肉的训练短期是可以接受的,考虑到单机版的sklearn、keras这么流行,也可以理解这一点。

从收益角度来看,AI系统的最大价值体现在与业务结合的部分,例如促进增长、降低成本等,其次才是对人效的提升,例如自动运营、自动训练。看清楚这一点,也就认同了从线上到线下的落地路径。

线上系统设计

线上系统包含两个部分,一部分负责模型打分,也就是inference,另外一部分是策略,以及与业务系统对接。

inference部分面临的问题,是如何支持各种不同的建模工具,例如sas、python、spark等等,如果对性能并发要求不高,就可以使用pmml的对应语言实现,快速上线获取短期胜利。

策略部分,一般可以映射成规则,使用drools这样的规则引擎实现,可以解决最初一段时间的绝大部分需求。

热心网友 时间:2024-09-20 18:48

明确需求之后,算法平台的设计就比较明确了,业界可以参考的例子包括*的fblearner和Uber的Michelangelo(如下图)。

可以看到,算法平台包含几个环节:

* 数据准备

主要是如何准备数据,并且管理数据在离线、近线和在线模式之间的分布。

* 模型训练和评估

主要是使用各种基础平台(Spark/Tensorflow/Xgboost等)训练模型,从数据中获取可以应用的模型和规则。

训练出来的模型,需要进行验证和评估,评估包括在训练集、测试集和时间外验证集上的表现,检查模型的性能表现(KS、AUC等)、拟合程度和时间衰减。

* 模型服务与业务整合

在离线选择好模型之后,就可以把它放到线上做实际的应用了,在真实系统中验证假设是否成立。

落地路径:线上系统-》到训练平台

在充满遗留系统的老企业或者人力不足的新企业,往往需要从线上系统开始。对于训练过程,经常看到成立几年的数据团队,还在使用单机电脑训练模型,在数据量不大的场景,半人肉的训练短期是可以接受的,考虑到单机版的sklearn、keras这么流行,也可以理解这一点。

从收益角度来看,AI系统的最大价值体现在与业务结合的部分,例如促进增长、降低成本等,其次才是对人效的提升,例如自动运营、自动训练。看清楚这一点,也就认同了从线上到线下的落地路径。

线上系统设计

线上系统包含两个部分,一部分负责模型打分,也就是inference,另外一部分是策略,以及与业务系统对接。

inference部分面临的问题,是如何支持各种不同的建模工具,例如sas、python、spark等等,如果对性能并发要求不高,就可以使用pmml的对应语言实现,快速上线获取短期胜利。

策略部分,一般可以映射成规则,使用drools这样的规则引擎实现,可以解决最初一段时间的绝大部分需求。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
whirlpool如何制热 如何查被录取到的专业 怎样查被录取的专业 录取后怎样查询录取的专业 录取专业怎么查 已被录取怎么查专业 ghs网络语什么意思_ghs网络语意思出处含义介绍 纸箱企业管理软件 ghs什么意思网络(ghs什么意思网络用语) 《喜羊羊与灰太狼》大结局 补办身份证需要带什么证件去 学生午睡多久最好 二十六个字母画法 手机上显示无效得IMEI 是怎么回事 抖音客服能帮忙找到自己在直播间的连麦记录嘛 说一说,钱程策略如何?可信吗 《重庆森林》影评 朋友老梦到我我去河边旅游什么意思 怎么才能让一个人不喝酒 中国人改了国籍还能改回来吗 中国人改国籍了还能改回来吗 电脑双根8g有什么区别? 爱而不得,不曾相忘(短篇小说完整版) 爱情得到却不能在一起叫什么? 有没有男主爱而不得的小说 ...银行声誉风险的因素?对于声誉风险的管理,应该包括哪些方面 企业微信里的健康安全助手怎么下载 she和her的用法与区别? 瓷盆养金鱼能出青苔吗 代理模式的简介 分期还款和最低还款哪个划算 长安之星2四年以后应怎样保养 360n4s骁龙版为什么插上联通大王卡是2g,大王卡是GSM还是TDLTE?_百度知... 360n4s在同环境下为何只有2g,别的手机则是4g 中信银行(芜湖)那个支行周日上班 如何解除微信的头像 大清,光绪,民国双旗十文一枚值多少? 微信发语音对方播放失败怎么回事? vivoz3i设置不了软件一天可玩时间? ps怎么合并指定的图层 张家口市宣化区邮编多少 河北省张家口市宣化区邮政编码 河北省张家口市宣化区车牌号开头字母是什么? 信用卡还了最低还款利息怎么算 什么是网络分支机构? 东财试题 分支机构网络文化许可证怎么办? 一个是饭店经理,用英语怎么说 梦见爸爸的坟 交通银行股份有限公司深圳宝安支行怎么样? 宝安西乡固戍附近交通银行营业厅