卓越方达logo200*800

KNIME简介

KNIME是一个免费和开源的数据分析、报告和集成平台。KNIME通过其模块化数据管道“分析构建块”概念集成了用于机器学习和数据挖掘的各种组件。图形用户界面和JDBC的使用允许组装混合不同数据源的节点,包括预处理(ETL:提取、转换、加载),用于建模、数据分析和可视化,而无需或只需最少的编程。

自 2006 年以来,KNIME 一直用于药物研究,它还用于其他领域,例如CRM客户数据分析、商业智能、文本挖掘和财务数据分析。最近尝试使用 KNIME 作为机器人过程自动化 (RPA) 工具。

KNIME 的总部位于苏黎世,在康斯坦茨、柏林和奥斯汀(美国)设有办事处。

历史

KNIME 的开发始于 2004 年 1 月,由康斯坦茨大学的一个软件工程师团队作为专有产品开始。最初由Michael Berthold领导的开发团队来自硅谷一家为制药行业提供软件的公司。最初的目标是创建一个模块化、高度可扩展和开放的数据处理平台,允许轻松集成不同的数据加载、处理、转换、分析和可视化探索模块,而无需关注任何特定的应用领域。该平台旨在成为一个协作和研究平台,并作为各种其他数据分析项目的集成平台。[5]

2006 年,KNIME 的第一个版本发布,几家制药公司开始使用 KNIME,许多生命科学软件供应商开始将他们的工具集成到 KNIME 中。那年晚些时候,在德国杂志c’t发表文章后,来自许多其他领域的用户加入船舶。截至 2012 年,KNIME 被超过 15,000 名实际用户使用(即不计算下载量,但用户会在更新可用时定期检索更新),不仅在生命科学领域,而且在银行、出版商、汽车制造商、电信公司、咨询公司和各种其他行业以及全球大量研究小组。KNIME 服务器和 KNIME 大数据扩展的最新更新,提供对 Apache Spark 2.3、Parquet 和 HDFS 类型存储的支持。

KNIME 连续第六年在 Gartner魔力象限中被列为数据科学和机器学习平台的领导者。

内部

KNIME 允许用户直观地创建数据流(或管道),有选择地执行部分或全部分析步骤,然后使用交互式小部件和视图检查结果、模型。KNIME 是用 Java 编写的,基于Eclipse. 它利用扩展机制来添加提供附加功能的插件。核心版本已经包含数百个数据集成模块(文件 I/O、通过 JDBC 或本机连接器支持所有常见数据库管理系统的数据库节点:SQLite、MS-Access、SQL Server、MySQL、Oracle、PostgreSQL、Vertica 和 H2) 、数据变换(过滤器、转换器、拆分器、组合器、连接器)以及统计、数据挖掘、分析和文本分析的常用方法。可视化支持免费的报表设计器扩展。KNIME 工作流程可以用作数据集来创建报告模板,这些模板可以导出为文档格式,例如 doc、ppt、xls、pdf 等。KNIME 的其他功能包括:

  • KNIME 的核心架构允许处理仅受可用硬盘空间(不限于可用 RAM)限制的大数据量。例如,KNIME 允许分析 3 亿个客户地址、2000 万个细胞图像和 1000 万个分子结构。
  • 附加插件允许集成文本挖掘、图像挖掘以及时间序列分析和网络的方法。
  • KNIME 集成了其他各种开源项目,例如来自Weka、H2O.ai、Keras、Spark、R 项目和LIBSVM的机器学习算法;以及plotly、JFreeChart、ImageJ和化学开发工具包。

KNIME 是用Java实现的,但它允许包装器调用其他代码,并提供允许运行Java、Python、R、Ruby和其他代码片段的节点。

许可证

从 2.1 版开始,KNIME 在 GPLv3 下发布,但允许其他人使用定义良好的节点 API 添加专有扩展。这也允许商业软件供应商添加从 KNIME 调用他们的工具的包装器。

KNIME 课程

KNIME 基于 Data Wrangling 和 Data Science 线提供两条在线课程。

更新 2024年9月5日