您现在的位置: 通信界 >> 市场动态 >> 新闻正文  
 
美国中佛罗里达大学王中庆教授:智能化建模是包含自动化的一种新的方式
[ 通信界 / 大数据文摘 / www.cntxj.net / 2018/8/19 18:07:11 ]
 

大数据文摘出品记者:CoolBoy、魏子敏在这个大数据盛行的时代,许多人对“机器学习、商业智能”这些名词只闻其声,不知其形,如何将大数据建模普及可能会是未来的一个焦点。本次我们邀请到美国中佛罗里达大学统计系教授王中庆老师,来与大家分享智能化建模的奥秘以及他对未来大数据技术的展望。

人物介绍:王中庆教授

王教授于1991年获得美国爱荷华大学统计博士学位,现任美国中佛罗里达大学教授兼数据挖掘中心主任。主要研究方向为数据挖掘,网络挖掘,数据挖掘在商业智能,教育智能及健康智能的应用。

指导过的学生团队在2011、2012和2016年国际SAS数据挖掘竞赛获胜。曾担任美国富国银行( WELLS FARGO)、美国蓝十字蓝盾保险公司( BlueCross and BlueShield)、美 国 Whole Foods Market、美国恒久银行( Ever Bank) 数据分析顾问。

文摘:目前市面上已有不少AI自动化工具(如谷歌的AutoML、国内第四范式的先知平台)相比,智能化建模与这些产品是一致的吗?王:这里提到的平台,基本进行的是自动化建模工作。而智能化建模是包含自动化的一种新的方式。在建模之前,系统会对数据进行预处理,提取出更多的信息量。比方说,数据中的缺失值就包含了很多信息,因为测不到数据也反映了某些事件的特征。那么利用MVP(缺失值补全技术)处理数据,可能就会使保险公司的事件预测准确度增长。

同时,提到的这些自动化建模工具做了许多人脸识别、声音识别的工作。这些数据的信息量大,使用深度学习的模型会有优势 。而智能化建模更适用于噪音相对高、信息量低的金融信贷和保险的数据,使用数据清洗和传统的数据挖掘方式进行智能建模。 在银行里对于不同的客户快速建立不同的模型,把更多的时间放在决策上的话,价值就很快体现出来了。

很重要的一点是,相对于优化测试准确率的传统建模观点, 智能化建模会略微牺牲准确率,专注于缩小训练准确率和测试准确率的差,也就是提升模型的稳定度。

另外,为了提升建模的速度,全局搜寻的方法应该被避免,最好是在每一步追求局部的最佳解。局部解的累积虽然可能不是最佳解,但是相对上会是一个理想的结果,并且会大大提升建模的速度。

文摘:如何平衡模型的速度、准确率和稳定度呢?王:首先,在数据清洗阶段,使用Java这个较快的语言会提高效率。 其次,建模阶段,我们使用了Python 的扩展库,并且采用平行处理的技术进行提速。这个平行处理平台是由我的合作伙伴蒋总亲自带队开发的,会比市面上流行的平台,如Sparks,更有效率。这个过程中还会有统计方法的介入,比如建立树模型的时候,如果先预计出一个最佳的层数,建模会省去很多不必要的时间。

在建模方面,我们对于每个变量首先进行缺失值处理,之后会对每个变量依次进行非线性变换与筛选。具体的说就是先计入单个变量的全部变换,再根据不重要性进行剔除。之后要分别建立不同模型,如树模型、线性模型等,再依照一定的规则进行模型混合。 为了控制模型的稳定度,一些正规化手段需要被采用。

之前有提到,智能化建模目前针对的行业,数据噪音都比较高。这就意味着,现实的情况和训练的数据会有一定的差距。因为我们要保证业务部门使用模型的时候,得到的反馈和试验的时候差不多,所以我们需要保证模型的稳定度,这样合作的公司使用智能建模的时候我们才会放心。

同时,未来的数据和现在的数据相比也会有一定的差异。由于现在社会发展很快,我们的生活习惯也改变得很快,比如在长途旅行上,大家以前更多选择飞机,现在则会考虑高铁。时间差会带来生活方式的改变,自然也就会带来数据的差异。从这个角度看,专注于测试准确率便不是一个理想的选择。那么实际情况也是如此--从敲定合同到产品部署,从获取数据到训练模型,都存在时间差。相比强调准确率,强调稳定度可以使模型适应这一时间差。

文摘:那么您对于自动化智能化建模的前景与看法是怎样的?王:这应该是未来的趋势。目前像传统行业,比如金融、保险,或是非传统行业,比如电商,基本没有不用数据的行业。

有些公司可能有专业的建模人员,但是人工建模需要先预处理数据,选择模型,选择变量,之后还要调试参数,需要花费很多时间。如果有1000个项目,在有限的时间内,可能人工只能建立起其中的100个,但是利用智能建模技术就可以完成这1000个建模任务。并且如果“建立模型”和“使用模型”都由同一个人来完成,更多的精力就可以放到制定决策上。

经管类的同学,有时需要数据建模来解决项目上的问题。利用智能建模技术,这些同学就可以在没有数据科学的背景下就完成建模,然后把更多的精力投入到问题的本身,从而提高效率。

想想手机的例子:十几年前,大家的手机只用来打电话发短信。而现在智能手机除了这些基本功能,还取代了钱包,甚至公交卡。我认为大数据会像智能手机一样,一定会改变我们的生活。那么将数据智能建模普及各个行业就会是一个大趋势。

我注意到最近也有开源的自动建模工具Auto-Keras发布。这些开源的工具肯定有它的优点,但主要还是面向数据从业人员的建模工作。而我们希望将智能化建模的工作交给无相关经验的人员,让他们可以简单完成数据建模。

另外,市面上现在有一些公司,如SAS,已经开发出了一些半自动的建模工具。在这些工具上,建模人员可以通过输入一些参数,自己调试来完成建模任务。而智能化建模技术则是在这个基础上迈出了更简化的一步。

之所以这些公司不愿意迈出这一步,是因为目前的软件会带来很多的,很稳定的年收入。如果进行了技术革新,他们需要重新发展整个市场,这就带来了不确定性,所以这些公司对革新一事还是保持慎重的心态。虽然现在智能化建模有着灵活性稍差,准确率稍低等缺点,但是,我认为全自动化智能建模技术终究会取代这些产品。

目前金融和保险还是智能化建模针对的主要方向,之后我们希望这项技术能应用到电网公司、风电公司、甚至整个工业大数据的方向来。

 

作者:大数据文摘 合作媒体:搜狐 编辑:顾北

 

 

 
 热点新闻
普通新闻 同级最强!天玑8200实测成绩放出,iQOO Neo7 SE神机配神U
普通新闻 中国信通院:我国部署超 7900 张 5G 行业虚拟专网
普通新闻 省内首个智慧康养平台,点亮“银发族”数智生活
普通新闻 中国移动与中国宝武签署战略合作框架协议
普通新闻 云巨头深陷高管离职风波!三千亿美元市值已蒸发一大半
普通新闻 中国软件三十年:烟尘隐入,夹缝重生
普通新闻 马斯克世界首富之位被LVMH老板短暂超越
普通新闻 苹果将推“高级数据保护”功能 允许用户对更多iCloud备份数据进行加
普通新闻 台积电加大对美投资建厂,半导体关键技术会外流吗?
普通新闻 数字化融入生活方方面面,红帽助力客户实现多维转型
普通新闻 爱立信移动市场报告:2028年5G签约数将超过50亿
普通新闻 我国将迈入百亿物联发展征途 分三阶段实现
普通新闻 黑客帝国重现?马斯克脑机公司将开展人体试验:有点疯狂
普通新闻 OpenAI发布新作:ChatGPT聊天机器人
普通新闻 2023年人工智能发展预测 企业如何成功采用AI?
普通新闻 爱立信:5G增长快于以往任何一代移动通信
普通新闻 突破千万大关之后 被误读低估的VR
普通新闻 台积电1nm新厂计划已上报 将落地新竹
普通新闻 三大运营商股价创年内新高,新发展模型下价值如何重估?
普通新闻 解密“个人信息保护认证”
  版权与免责声明: ① 凡本网注明“合作媒体:通信界”的所有作品,版权均属于通信界,未经本网授权不得转载、摘编或利用其它方式使用。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:通信界”。违反上述声明者,本网将追究其相关法律责任。 ② 凡本网注明“合作媒体:XXX(非通信界)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。 ③ 如因作品内容、版权和其它问题需要同本网联系的,请在一月内进行。
通信视界
新华三:云智原生 AD-NET构筑智能联接新底座
华为林永明:ADN 铺就高阶自智网络之路
普通对话 中国移动丁海煜:三大方向十大技术,5G-A赋
普通对话 英特尔王锐:中国战略是我们的全球战略之重
普通对话 新华三:云智原生 AD-NET构筑智能联接新底座
普通对话 华为林柏枫:联接升级,激发商业增长
普通对话 华为林永明:ADN 铺就高阶自智网络之路
普通对话 NVIDIA发力数字孪生:站在虚拟和现实之间
普通对话 韦乐平:网络深度转型最明确的方向首先就是
普通对话 中国工程院院士邬贺铨:6G标准面临小圈子风
普通对话 华为丁耘:绿色ICT,共创新价值
普通对话 爱立信中国区总裁方迎:将在中国市场重点做
普通对话 中国联通买彦州:广电5G商用对行业竞争格局
普通对话 中国联通陈忠岳:从“提速降费”向“提速提
普通对话 华为胡厚崑:5G+工业互联网 数据驱动是关键
普通对话 华为郭平:每个人磨好自己的豆腐,就会有一
普通对话 中国移动杨杰:加快推进新型平台用工模式规
通信前瞻
北斗三号卫星低能离子能谱仪载荷研制成功
中国移动李慧镝:强化数智基建驱动 推进产业转
普通对话 物联网设备在智能工作场所技术中的作用
普通对话 软银研发出以无人机探测灾害被埋者手机信号
普通对话 AI材料可自我学习并形成“肌肉记忆”
普通对话 北斗三号卫星低能离子能谱仪载荷研制成功
普通对话 为什么Wi-Fi6将成为未来物联网的关键?
普通对话 马斯克出现在推特总部 收购应该没有悬念了
普通对话 台积电澄清:未强迫员工休假或有任何无薪假
普通对话 新一代载人运载火箭发动机研制获重大突破
普通对话 多管齐下,VMware跨云服务助力企业云转型
普通对话 中国移动李慧镝:强化数智基建驱动 推进产业
普通对话 苏少林:打造北京数字经济“五强”,助力标
普通对话 中国科大在高安全量子密钥分发网络方面取得
普通对话 华为杨超斌:迈向5.5G持续创新,开启5G产业
普通对话 中国联通买彦州:加强创新力度,协同推进6G
普通对话 信通院总工敖立:5G工业模组是产业链特别短