首页 观点分析 【Pipeline Pilot应用实例】达索系统BIOVIA Pipeline Pilot分享–机器学习

【Pipeline Pilot应用实例】达索系统BIOVIA Pipeline Pilot分享–机器学习

关注泰科科技 做模拟不迷路 哈姆雷特当然有很多心事,也许正因为如此,他不可能成为一个优秀的软件推销员。

 关注泰科科技   做模拟不迷路

 

【Pipeline Pilot应用实例】达索系统BIOVIA Pipeline Pilot分享--机器学习

 

哈姆雷特当然有很多心事,也许正因为如此,他不可能成为一个优秀的软件推销员。然而,作为一个软件开发人员,我们应该积极地看待他探索替代方案的愿望。即使在一个特定的范例中(让我们把自己限制在数据流水线上),也不是只有一种方法可以做到这一点。

如果我们通过网络查看我们共享的关于数据管道的知识(参考文献1是一个很好的起点,当然也有很多链接),我们可以找到各种各样的实现,可以追溯到50多年前。可视化编程范式实际上并不是在这场游戏的后期出现的(1966年是我发现的一份参考资料的日期),尽管它在过去的五年中确实迅速发展起来。

可重用组件网络的概念可以被发挥到极致,它可以可视化地连接到管道中,并配置为执行特定任务。事实上,在作者所选择的数据流水线工具BIOVIA Pipeline Pilot中,作者最喜欢的工具条(如下图所示)显示了一点偶像崇拜的色彩。

【Pipeline Pilot应用实例】达索系统BIOVIA Pipeline Pilot分享--机器学习

 

What are the Components?

这两个圈起来的部件不是用它们的名称而只是用符号表示。它们的动作由过滤(拆分数据管道)和操作管道上的数据的抽象概念表示。

【Pipeline Pilot应用实例】达索系统BIOVIA Pipeline Pilot分享--机器学习

然而,这些都是基于脚本的组件(它们的确切名称是自定义操纵符(PilotScript)和自定义过滤器(PilotScript))。第一种方法允许对流经管道的数据进行任何基于脚本的操作,第二种方法允许使用类似的脚本,但使用最后的语句求值为布尔值,这将管道分为两个部分。

 

它们都为用户提供了一个相当不错的表达式编辑器,具有您所期望的一切(语法高亮显示,智能感知,查找&放大器;替换,等等)。在下面的图中,我们展示了点击热键时的表达式编辑器,它会提醒您在数据管道的那个点上有哪些属性可用:

【Pipeline Pilot应用实例】达索系统BIOVIA Pipeline Pilot分享--机器学习

这个特定的组件应用了PilotScript,这是Pipeline Pilot的原生脚本语言。但如果您喜欢Python或Java,则可以找到类似的组件。

 

但这不是一种亵渎吗?当我们可以使用正确配置的组件来完成我们需要的工作时,我们应该编写脚本吗?必须让我们停下来。

 

举个例子应该会有帮助。我们最近帮助某人修改了一些数据,这些数据具有个人发明的数据格式的通常特征,永远不会重新遇到(用空行分隔的记录组、莫名其妙的类似json的[和]等)。

 

第一步是使用数据和一些分组组件进行一些极端的编程,但我们很快意识到Pipeline Pilot也允许您编写脚本,几分钟内我们就得到了我们想要的东西。

Conclusion

当然,实现这一点的是脚本语言中可用的函数或方法。这就是为什么我们为Java和Python这样的大热门编写脚本。但是PilotScript也提供了很好的函数,从操作(可能是分层的)数据记录的函数集,到操作化学反应的函数集,再到操作组件本身的函数集(因此在可视化语言上进行编程,这是一个非常有用的功能)。

 

这就是它应该有的样子。作为开发人员,我们对自己的工具和技能有很好的了解,应该能够根据一时的冲动做出选择,而不是遵循任何范式。正如哈姆雷特所引用的:“不要因为思想的苍白而生病。”相信自己,抓住你本能地认为是正确的工具。只要确保你有一个完整的工具箱。

文章详情:

本文翻译至达索BLOG

 

北京泰科涉及行业

材料研发

基于BIOVIA Materials Studio材料设计平台,提供涉及电池、航空航天、国防军工、建筑、涂料涂层等多领域材料研发软件及综合解决方案。

药物研发

针对药物设计、药物研发等提供基于Discovery Studio、COSMOLOGIC等软件的ADME、构象比对、溶剂筛选、结晶、成盐、共晶筛选、稳定性、溶解度pKa、分配系数等性质的模拟预测软件及方案。

化工设计

面向精细化工、新能源、石油化工等领域提供精馏萃取催化剂设计、热力学性质(溶解度、粘度等)、提纯表面处理吸附等性质模拟软件平台及解决方案。

数据挖掘

基于Pipeline Pilot提供数据搜集、数据清洗、特征工程、机器学习、流程设计等多种数据挖掘综合解决方案。

一体化实验室

• 实验室信息管理

• 电子实验记录本/SOP执行

• 试剂耗材管理

• 仪器管理

• 数据管理

部分产品

量化材料类

• Crystal:固体化学和物理性质计算软件

• Diamond:晶体结构数据可视化分析

• Endeavour:强大的求解晶体结构的软件

• Molpro:高精度量化软件

• Molcas:多参考态量软件                   

• Turbomole:快速稳定量化软件

• TeraChem:GPU上运行的量化计算软件

• Spartan:分子计算建模软件

数据分析类

• GelComparll:凝胶电泳图谱分析软件

• SimaPro:生命周期评估软件             

• Unscrambler:完整多变量数据分析和实验设计软件   

• CSDS:剑桥晶体结构数据库

• lCDD:国际衍射数据中心数据库

• ICSD:无机晶体结构数据库

• Pearson’s CD:晶体数据库

公司简介

北京泰科博思科技有限公司(Beijing Tech-Box S&T Co. Ltd.)成立于2007年,是国内领先的分子模拟及虚拟仿真综合解决方案提供商。

北京泰科博思科技有限公司与国际领先的模拟软件厂商、开发团队深入合作,为高校、科研院所和企业在材料、化工、药物、生命科学、环境、人工智能及数据挖掘、虚拟仿真教学等领域提供专业的整体解决方案。用户根据需要在我们的平台上高效的进行各种模拟实验,指导实际的生产设计。

北京泰科博思科技有限公司拥有一支一流的技术服务团队和资深的专家咨询团队,以客户真正需求出发,服务客户,为客户创造价值。我们秉承“职业、敬业、担当、拼搏、合作”的企业精神,致力于用国际领先的软件产品和专业全面的技术支持服务,成为客户可信赖的合作伙伴。

2022年第37期应用实例赏析-02

 

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。

作者: suifengmianlai

为您推荐

一文秒解erp和sap系统哪个好用

ERP和SAP系统是企业资源规划(ERP)软件应用的两大供应商,ERP专注于数据结构和资源管理,面向小型企业。

电商数据分析怎么做,这里讲得很清楚了

关于电商数据分析怎么做的问题,有人从电商数据整理、分析开始讲,有人则着重于分析方法的介绍,也有人侧重于分析报表的制作。

质量管理 | 工业4.0背景下的质量数据分析-工业数据中心方法论

作为工业4.0的重要组成部分,质量4.0概念比以往任何时候都更加重要。

经典:商业智能BI解读,值得收藏

关注新闻的朋友们可能注意到了,最近这段时间关于数据要素、数字经济、数字化转型的相关行动越来越多,一方面是各级政府的政策规划以及大规模的发展行动,另一方面是则是各行各业的企业开始探寻数字经济,通过数字化转型进行改革,充分发挥数据价值。

电商数据分析方案和BI强强联合,一站式做分析

搭建一个电商大数据分析平台需要哪些条件?总的来说需要一套满足电商数据分析需求的方案,一个能够提供强大数据计算分析功能和数据可视化图表的平台,比如电商数据分析方案和奥威BI软件这样的组合。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部