可能超级计算机和大数据时代, 没有智能方法存储所有数据, 仅仅是数字分解法之多能源局LawrenceBerkeley国家实验室(Berkeley实验室)和UCBerke
论文最近发布国家科学院记录PNAS研究者描述一种叫作“随机森林”技术,他们说它可能对科学或工程中包括生物学、精密医学、材料科学、环境科学以及制造等复杂系统的任何领域产生改变效果
取人机举例单单元中可能有10170分子交互伯克利实验室分子生态系统生物系主管Ben Brown表示,方法能识别高阶交互作用 计算成本与主要效果相同 即使是那些交互作用局部弱边际作用
UC伯克利分校Brown和Bin Yu主编Sumanta Basu和Karl Kumbier合编UC伯克利统计系Yu学生论文是三年工作结晶 作者认为这将改变科学实现方式Brown说,“用我们的方法,我们可以获取比我们从学习机中获取的信息更丰富得多的信息。”
机器学习科学需求不同于行业需求, 机器学习被用于下棋、自驾车和预测股市
实业界开发机器学习是伟大的 如果你想在股市做高频交易,Brown说"你不在乎为什么你能预测股票上下上下只是想知道你能预测。”
但在科学方面 围绕过程行为某些方面 问题至关重要理解“原因”允许科学家建模或工程师进程提高或实现期望结果机器学习科学需要黑盒内对等并理解计算机达成结论的原因和方式长期目标是使用这类信息建模或工程系统获取期望结果
高度复杂系统-无论是单细胞、人体甚至是整个生态系-有大量变量非线性交互作用这使得很难甚至不可能建模型来确定因果布朗说, “不幸的是,生物学中,你经常会遇到顺序30、40、60交互作用完全难以用传统方法统计学习
由Brown和Yu领导的团队开发方法迭代随机森林基础算法称随机森林,即常用有效预测建模工具,将黑盒学习者内部状态转换为人解式方法允许研究者通过拆分交互顺序或大小与计算识别成本相容查找复杂交互
Brown说,“检测顺序30交互数与顺序二交互数没有差别”。即大海变换
PNAS论文中科学家展示了方法处理两个基因组问题:基因增强者在果蝇胚胎中的作用和替代从人体生成细胞线复制在上述两种情况下,使用iRF确认先前发现并发现前未识别高阶交互作用供后续研究
布朗表示,他们正在使用方法 设计相位数组激光系统 优化可持续农业系统
UC伯克利电气工程计算机科学系教授Yu表示,iRF除预测外还引入稳定性,以便更可靠地学习预测器底层结构
Brown补充道, “这使我们能够学习如何设计面向目标优化和更精确定向模拟和后续实验系统”。
内PNAS注释多伦多大学的Danielle Denisko和Michael Hoffman写道 :iRF大有希望,是检测各种环境交互作用的新有效方式,使用iRF会帮助我们确保树枝或叶子永远不翻转。”
文件基础:快速原型设计

