看看888贵宾会登录网址是如何通过数据谱系帮助Epona Science的, 转换, 版本控制, 和集装箱化.
Epona Science专注于购买,培育和识别世界上最好的赛马. 每一种纯种马都有数百万美元的投资,风险很高. 买家和育种者希望获得尽可能最好的信息,以便在挑选下一个传奇冠军时获得优势.
赛马行业有着悠久而传统的历史. 过去很多买家 简单地买马与血统或从一个值得信赖的饲养员谁似乎知道 天生最好的马. 但这些真的是成功的最佳预测指标吗? 在其他运动中,比如 在棒球中,888贵宾会登录网址已经看到深入的统计分析击败了著名经理人的直觉. Sabermetrics在电影《888贵宾会登录网址》中不朽,帮助波士顿红袜队横扫 胜利结束了近一个世纪的冠军荒. 现在各大运动队都依赖 数据和直觉一样重要. 成为一个成功者有无数的因素 人们往往倾向于关注错误的东西.
80%的数据科学是找到正确的数据,把它拉下来, 提取,转换,加载. 每种类型的数据都有其自身的挑战. 只需要 一天和几百美元来测序整个基因组,但通常这些快速测序机 犯小错误.
Epona打算用机器学习彻底改变这个历史悠久的行业, 统计分析及 科学. 在此过程中,他们发现了这匹马的所有基因特征 血统, 动物的身高和步态, 对它心脏的大小都能做出一个不同的决定 一匹赢了,一匹没能真正走出大门
888贵宾会登录使888贵宾会登录网址能够快速构建和维护一个健壮的自动化数据科学管道,该管道可扩展且完全可重复.
由于赌注如此之高,马饲养者是一个孤立而紧密的群体. 他们很快意识到 这些数据可以讲述自己的故事,并颠覆传统的销售模式,因此他们会采取保护措施. 这意味着 Epona必须从世界各地的很多资源中获取信息, 无论是x光,基因还是轨迹 往届比赛记录. 收集所有的数据,清洗,标准化,然后把它放进 他们的机器学习模型可以训练的一致格式需要大量工作.
“基因数据总是不完美的,”Epona数据科学主管瑞安·史密斯(瑞安史密斯)说. “有些人失踪了 基因型,错误标记的位. 你可以用不同的算法来缓解这些问题 但如果你改变了你所使用的方法来减轻它, 你得知道为什么 改变了.“缓解解决方案的突然变化很容易使你的模型陷入混乱.
史密斯说,汇编所有这些数据有点像“财政建模”. “这匹马的股价怎么会上涨呢 或下降?但对Epona的团队来说,处理这一切需要几周或几个月的时间. 他们有太多的手动操作 步骤和许多小的粘合脚本来拉取数据并转换它. 他们的管道、处理和MLOps工作流程需要走得更快. 这是 厚皮动物是怎么出现的.
888贵宾会登录立即在团队中脱颖而出,因为它能处理从 数据沿袭,到数据 转换和版本控制,到容器化. “如果没有集装箱化,”史密斯说,“处理 设置很困难,如果你能在Docker中完成,你可以省去很多痛苦."
888贵宾会登录平台 本地数据版本控制 来源工具提供了向后滚动和 向前. 他们可以看到发生了什么变化,时间和原因. 这个团队的模型是微妙的,敏感的 有时,他们的工程师需要做详细的取证分析,以找出模型的去向 错了,这样他们就能快速修复.
他们还发现该平台比其他平台(如《888贵宾会登录网址》)更简单, 哪些更死板,哪些不是 首先为Kubernetes设计. 像数据科学中的任何人一样,他们用Python做了很多工作,但他们需要 能够灵活地使用其他语言工作.
Epona Science的模型开发吞吐量现在是有效的连续的. 他们的每一个模型 每个样本, 尤其是基因样本, 在管道中运行, 进行测试并上传到 分分钟浏览网站. 在过去,这需要几天或几周的时间,一路上有很多手动步骤. 之前 厚皮动物他们没有能力将整个过程的每一部分都完全自动化, 当模型得到 用新的信息一次又一次地重建. 对于一个小团队,他们需要专注于模型 建筑不是手动步骤.
自动定量 也给他们带来了巨大的改变. 2020年,他们处理了1万张新照片 一个月前一年花了一年的时间才拍出这么多照片. 使用自动缩放,他们可以留下一个 集群站起来,并根据需要建立它. 过去他们做动物模型的时候用的是 巨大的机器,拥有tb的ram和尽可能多的内核,但成本高昂. 现在Kubernetes可以加速训练,并将其分发到pod中,这样他们就不必启动一个大型实例, 运行作业并调试它,并记得将其关闭.
Epona正在改变高风险赛马业务的运作方式, 厚皮动物给了它们 他们需要的引擎,为浸透传统的企业带来新生命.
很多软件工具都来自学术界.它们是由研究人员开发的,还没有为企业做好准备. 888贵宾会登录是由拥有真实世界经验的工程师建造的. 这工具是最尖端的. 888贵宾会登录已经改变了他们做生意的方式,因为888贵宾会登录网址不再需要孤立地经营一切.