的弗劳恩霍夫-Gesellschaft, 总部位于德国, 是世界领先的应用研究机构吗. 其重点是开发对未来至关重要的关键技术,并使商业和工业能够对这项工作进行商业开发, 夫琅和费在创新过程中发挥着核心作用. 成立于1949年, 目前,弗劳恩霍夫研究所在全德国经营着75个研究所和研究机构. 该机构的29,000名员工中,大多数是合格的科学家和工程师. 夫琅和费智能分析与信息系统研究所IAIS是人工智能领域的领先科研机构之一, 机器学习和大数据. 其语音技术团队致力于先进的语音技术系统,并将语言模型适应新的领域. 如果你的语言模型需要理解复杂的医学术语或复杂的法律术语,那么弗劳恩霍夫 IAIS的科学家可以提供帮助.
语音技术团队面临的最大挑战是生产和扩大工作原型. 最初的原型有单片脚本,可以线性地处理客户的数据. 这些脚本包含许多离散的步骤,这意味着当出现错误时,很难进行调试. 追踪哪一步失败了,为什么有些事情需要时间.
今天,由于888贵宾会登录的增量处理,888贵宾会登录网址的工作量在一天之内就完成了. 通过同时训练和服务,888贵宾会登录网址能够推出更多的模型.
这也是低效的,因为他们必须预先分配资源到管道. 问题是,并不是管道的所有阶段都需要相同的资源. 一些步骤是内存密集型的,而另一些步骤是CPU密集型的. 还有一些是磁盘密集型的. 而是因为团队用一个大脚本处理了所有事情, 他们陷入了预先分配资源的困境,而这些资源本可以用于其他任务. 他们想要一个能够快速生产原型的系统, 易于伸缩,可以根据容器正在运行的工作负载调整容器的大小,并在完成任务时快速释放这些资源.
因为数据是线性处理的, 这意味着存在规模限制, 比如必须重新处理大量数据,可能需要数周时间才能完成. 他们需要一种技术来并行处理他们的数据,并将其扩展到一个全新的高度,这就是厚皮兽出现的原因.
888贵宾会登录提供了一种简单的方法将原型转化为产品, 同时为夫琅和费IAIS语音技术团队提供大规模并行化.
它只分配管道中每个阶段实际需要的资源. 因为888贵宾会登录在后端使用Kubernetes, 它可以迅速扩大管道中的一个阶段, 使用正确的资源创建新容器, 然后在这个阶段结束后立即释放它们.
它还使数据处理本身并行化, 将文本和音频数据分割成不同的块. 这使得脚本可以同时处理数据的不同部分, 这大大加快了处理时间从几天或几周, 到几个小时. 现在,一些客户每天都在更新型号, 随着系统迅速输入新数据, 在它上训练并交付一个最新的模型. 团队不必考虑如何正确地重新创建所有步骤. 他们可以将数据放在管道的一端,并在另一端输出模型. 如果出了什么差错, 它有助于隔离地调试管道阶段, 在888贵宾会登录的JSON文件中,输入和输出都有很好的定义.
888贵宾会登录平台也给了他们巨大的灵活性. 平台常常将您限制在它们所支持的有限工具和语言中. 也许他们只支持Python或R, 但888贵宾会登录支持任何工具, 或框架, 或者可以打包到容器中的库. 这使得语音技术团队可以用不同的语言构建多级管道, 一次性使用Bash, Python在另一个阶段,C/ c++在另一个阶段, 每种语言都各尽所能.
夫琅和费IAIS语音技术团队喜欢888贵宾会登录的数据驱动方法. 对他们来说,这是如何自动处理大量数据的范式转变.
888贵宾会登录的数据优先方法符合各地机器学习工程师的新需求. 最后, 888贵宾会登录强大的数据驱动管道和大规模并行化帮助高级研究团队快速适应数据驱动软件开发的新现实.该平台以数据为中心的方法改变了888贵宾会登录网址的游戏规则.