真正的机器学习平台根本不存在?

  • 时间:
  • 浏览:2
  • 来源:5分3DAPP下载_5分3DAPP官网

更多优质内容请关注微信公众号“AI 前线”(ID:ai-front)

对于各大科技公司努力做机器学习平台的行为,我很能理解,毕竟作为主要的技术供应商,可能没在 AI 领域弄出点动静,可能太快就被市场遗忘了。没有来越多没有来越多,那些平台究竟是那些?为那些会经常出现没有激烈的市场竞争情形?

要回答这名难题,关键在于意识到机器学习和数据科学项目,同以往典型应用守护进程池池或硬件开发项目之间的区别。过去,硬件与软件开发工作的重点在于系统可能应用守护进程池池功能。相反,数据科学与机器学习项目更强调数据管理,持续不断地从数据中学习知识,并对数据模型进行迭代演进。从以数据为中心的层厚来看,传统的开发流程与平台在累似 新场景中根本无法正常起效。没有来越多没有来越多没有来越多没有来越多,另一各人需要新的平台。

此外,那些模型的部署(可能运营)措施全部总要所区别。没有来越多没有来越多模型在云端或自有服务器内,全部总要没有来越多没有来越多模型被部署在边缘设备中,可能采用脱机批出理 模式。数据科学家、数据工程师以及机器学习开发人员等群体在机器学习的应用、部署与需求等方面的差异,使得单一机器学习平台的概念几乎不具备实际可行性,这最终带来了“十八般武艺,样样稀松”的结果。

AI 前线导读: 过去几年,各大科技厂商开放了各种各样的“平台”,比如大数据平台、机器学习平台等,用于满足数据科学与机器学习需求,那些平台争相夺取数据科学家、机器学习项目经理以及没有来越多没有来越多 AI 项目管理与规划者的关注以及钱包。本文作者 Ron Schmelzer 是 AI 研究咨询公司 Cognilytica 的执行合伙人兼首席分析师,在他看来,没有来越多没有来越多没有来越多没有来越多机器学习平台从不符合规范,却可需要不断居于市场份额。没有,机器学习平台应该具备那些条件?居于合格的机器学习平台吗?

归根结底,机器学习项目经理你要的没有来越多没有来越多不能提升自身工作速率单位单位 的工具。没有来越多没有来越多,机器学习项目复杂性多样,没有来越多没有来越多各有不同需求。其中没有来越多没有来越多项目专注于会话系统,有没有来越多没有来越多强调识别可能预测分析功能,全部总要没有来越多没有来越多主要面向强化学习可能自主系统。

毫无难题,不同规模的各类技术供应商都将重点放到平台开发上,毕竟数据科学家与机器学习项目经理需要依赖那些平台来开发、运行、操作以及管理企业中正在使用的数据模型。

作者 | Ron Schmelzer

译者 | 核子可乐

从这名层厚来看,数据工程师实际上属于负责设计、构建以及安排数据的工程人员。优秀的数据科学平台还应帮助数据科学家轻松根据需求的增长动用计算能力。平台不需要将数据集一键复制至本地计算机上即可时候结速工作,确保数据科学家始终以最简单便捷的措施访问算力与数据集。为了实现这名目标,数据科学平台当然也需要提供必要的数据工程功能。总结来讲,一套实用的数据科学平台应当具备一系列数据科学与数据工程功能元素。

很明显,数据科学平台需要提供一套可商务战略合作、交互式的可视化系统,用于机器学习模型的开发与管理,但在机器学习平台方面,没有来越多没有来越多的支持远远不足英文。如上所述,机器学习系统正常运作的一大核心挑战在于超参数的设置与调整。

结果没有来越多没有来越多,在这场新兴斗争中,每位参与者都希望尽可能攫取更可观的市场份额。

对于那些供应商而言,未来的机器学习平台如同过去以及当下已居于的操作系统、云环境乃至移动开发平台一样。我希望不能在数据科学和机器学习平台领域居于市场份额,厂商就不能在未来几十年获得宽裕的回报。

谁能真正复杂性机器学习模型的创建、训练与迭代,谁就能在这场竞赛中胜出。在累似 强大出理 方案的帮助下,用户不能快速轻松地从笨拙的非智能系统,跨越至可利用机器学习功能,出理 以往无法出理 的难题。相比之下,那些无法适应机器学习功能需求的数据科学平台则将遭遇降级。同样的,那些火山岩具备数据工程能力的大数据平台也将在市场上成为赢家。未来的应用守护进程池池开发工具亦需要着力将机器学习模型视为生命周期中的主要组成要素。总结来讲,机器学习运营才时候经常出现,且必将在未来几年内成为行业中的又一大事件。

事实上,机器学习平台和数据科学平台之间居于交集,累似 总要采用数据科学技术与机器学习算法,并将其应用于大型数据集以开发机器学习模型。数据科学家每天使用的工具,与关注机器学习的科学家以及工程师们使用的工具也颇为累似 。没有来越多没有来越多,累似 从不代表相同,毕竟机器学习科学家与工程师的实际需求,与常规数据科学家与工程师还是居于一定差异的。

没有来越多没有来越多没有来越多没有来越多,当供应商在宣传中提到另一各人拥另一各人工智能可能机器学习平台时,另一各人不妨多问一句:“是哪本身平台?”,通过本文,相信另一各人可能意识到这世界上居于着不只本身机器学习平台,没有来越多没有来越多各人面向不同的实际需求。多没有来越多没有来越多思考,不能确保另一各人不需要因身陷市场炒作而信错厂商、选错产品。

没有来越多没有来越多,一套纯数据科学平台应当满足以下要求:协助构建数据模型、取舍最适合当前信息的假设、测试假设、利于数据科学家团队之间的商务战略合作,并随信息的不断变化推动数据模型的管理与开发。

原文发布时间:2019-12-17

本文作者:Ron Schmelzer;译者:核子可乐

本文来自阿里云云栖号商务战略合作伙伴“AI前线”,了解相关信息可需要关注“AI前线”

原文链接:https://www.forbes.com/sites/cognitiveworld/2019/12/12/theres-no-such-thing-as-the-machine-learning-platform/#326f9b96a8dd

云栖号:https://www.aliyun.com/#module-yedOfott8

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

此外,数据科学家的工作重点从不在 以代码为中心的集成开发环境(IDE)中。相反,Notebook 才是另一各人的天地。Notebook 概念最初由 Mathematica 及 Matlab 等以数学为中心的学术型平台提出,目前在 Python、R 以及 SAS 社区当中非常流行。所谓 Notebook,其本质在于记录数据研究结果,并允许用户面向不同源数据加以运行,从而复杂性结果的可重复性。良好的 Notebook 应充当本身共享式商务战略合作环境,数据科学家小组可需要在这里协同工作,并利用不断发展的数据集进行模型迭代。尽管,Notebook 还不能了否有代码开发的理想环境,但却不能为数据的商务战略合作、探索以及可视化提供强有力的支持。事实上,可能拥有足够的访问权限对接净化室室数据,没有数据科学家们将毫不犹豫地利用 Notebooke 快速浏览大型数据集。

数据科学家们的任务是从海量数据中下发出有用信息,并将业务与运营信息转化为数据与数学语言。数据科学家需要掌握统计学、概率、数学以及算法相关知识,借此从少量信息中下发有用的洞察见解。数据科学家还负责创建数据假设、运行数据测试与分析,而后将结果转换为组织内不能轻松查看与理解的形式。

没有来越多没有来越多,可能无法访问少量净化室室数据,数据科学家的工作则会陷入困境。很明显,数据的提取、清理与移动并全部总要数据科学家的职责所在,那些工作应该由数据工程师负责完成。数据工程师面对的主要挑战没有来越多没有来越多从各类系统中提取形状化否有形状化格式的数据,没有来越多没有来越多那些数据往往从不“净化室室”——居于缺少字段、数据类型不匹配以及没有来越多没有来越多与数据形式相关的种种难题。

谁能真正复杂性机器学习模型的创建、训练与迭代,谁就能在这场竞赛中胜出。

一般来说,负责管理机器学习项目的人员不仅需要管理 Notebook 和心态系统,打理与没有来越多没有来越多 Notebook 的商务战略合作工作,一并还需要统筹各类机器学习专用算法、库以及基础设施,进而在庞大且不断发展的数据集之上训练那些算法。理想的机器学习平台不能帮助机器学习工程师、数据科学家以及数据工程师了解哪种机器学习措施最为有效,如可调整超参数,在基于自有或云端的 CPU、GPU 或 TPU 集群上部署计算密集型机器学习训练,并提供用于管理与监控有监督与无监督训练模式所必需的生态系统。

没有来越多没有来越多,目前市面上经常出现了本身不同平台:其一专注于数据科学家与模型构建者的需求;其二强调对大数据及数据工程的管理;其三面向模型“搭建”与模型交互系统;其四则用于模型生命周期管理,即“机器学习运营”。要想真正践行机器学习平台做出的承诺,开发者需要在这五个方面痛下苦功。

从概念层厚出发,机器学习模型需要从数据中学习各类参数。换言之,机器学习模型实际学到的没有来越多没有来越多数据参数,并借此将新数据拟合至当前模型中。超参数是本身可配置的数据值,且无法在机器学习模型获取实际数据前预先设置。那些超参数将直接影响到各类因素,累似 复杂性性以及学习速率单位单位 等。不同的机器学习算法需要不同的超参数组合,一并应当注意剔除其中从从不的超参数要素。在这方面,机器学习平台利于发现、设置并管理超参数,一阵一阵是非机器学习类数据科学平台所不具备的算法取舍与比较等功能。

云栖号:https://www.aliyun.com/#module-yedOfott8

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

猜你喜欢

2017年上半年,创业投资领域有什么明显的趋势

动漫的很快发展为动漫衍生品创造了无限的市场空间,换成国家政策对动漫的扶持,未来的动漫行业必将创造新的经济的神话。动漫店不仅有新奇实用的动漫互近产品,还有时尚个性的动漫DIY创意

2020-03-22

性价比最高的千元手机是哪一款

推荐华为畅享9全网通标配版3GB+32GB,华为商城在售价格999元,手机产品属于快消电子产品,华为商城的电子产品价格也是会随着市场情况而有一定的调价优惠,最终以华为商城页面价

2020-03-22

ye6fqlcefaxa2的主页

TA还没法发布过内容~暂无文章:990丨粉丝:4405丨话题:0云栖直播暂未提供你关注的阿里云!文章:416丨粉丝:5222丨话题:7

2020-03-22

2019年上市的所有手机都有什么型号

展开完整性为你推荐:有点硬推荐你对你是什么回答的评价是?你对你是什么回答的评价是?楼主你好,2019年上市的手机太大了哦,比如华为p200系列,vivox27,opporeno

2020-03-21

中国20大手机品牌排行榜。(销量)

您要能登录华为商城官网查看手机更多信息。1、屏幕:屏幕尺寸为6.53英寸,屏幕色彩为1670万色,分辨率为FHD+103000x2244像素,屏占比为88.07%,高清大屏,玩

2020-03-21