1、Palantir
这公司 2003 年成立的,是 PayPal 创始人彼得・蒂尔他们创立的。总部在美国硅谷,专门给政府、金融机构还有企业提供大数据分析和帮忙做决策的服务。在好多地方都有办公室,员工超过 2500 人呢。它特别擅长整合和分析数据,能处理几十亿条数据记录,把不同地方来的数据融合到一起分析。用的机器学习和人工智能技术很先进,准确率能有 90% 以上。能帮客户做情报分析、风险评估还有欺诈检测这些事儿。比如在金融领域,一年能帮客户发现好多百万美元的欺诈行为。数据主要是政府机构、金融机构、企业给的,还有公开数据源和网络数据啥的。每天能处理来自好几千个地方的数据。它的技术有时候能帮着维护国家安全和执法,打击犯罪,但也可能因为处理的数据有个人信息,让人担心隐私问题。比如说个人的金融交易数据可能被用来查欺诈,但也可能被乱用。
2、Splunk
2003 年成立,总部在美国旧金山。是全球很牛的大数据分析软件公司,给企业提供实时的数据监控、分析和能让人看明白的解决方案。在全球有好多万家客户,各个行业都有。它的日志分析能力特别强,几分钟就能处理好几百万条日志记录。用的分布式架构,能适应各种规模的企业。能帮企业随时看着系统运行情况,发现问题赶紧解决,还能优化性能。比如在电信行业,能帮运营商看着网络性能,提高服务质量。数据主要是企业内部各种系统和设备产生的日志数据、传感器数据这些。每天能处理来自好几百万个设备的数据。对在企业上班的人来说,这技术能提高工作效率和系统稳定性,间接影响工作体验。但要是企业管不好数据,个人信息可能会泄露。比如个人的工作邮件或文件可能被误分析。
3、Cloudera
是 Facebook、谷歌、雅虎的前工程师还有甲骨文前高管创建的,总部在美国。给企业提供基于 Apache Hadoop 的大数据解决方案。在全球有好几千家客户,大企业和政府机构都有。以开源的 Hadoop 技术为基础,做了优化和扩展,弄出了企业级的数据存储、处理和分析平台。能处理 PB 级别的数据量,还能支持好几千个节点的集群。能帮企业存很多数据、处理数据,还能做数据分析和机器学习这些高级的事儿。比如在医疗行业,能帮医院分析患者数据,提高医疗质量。数据可以从企业内部各种数据源接入,像数据库、文件系统、传感器这些,也能处理外面来的数据。每天能处理来自好几万个数据源的数据。在企业里,这技术能让企业更好地用数据,可能给个人带来更好的产品和服务。但个人的行为数据也可能被收集分析,让人担心隐私问题。比如个人的购物习惯可能被用来精准营销。
4、Teradata
1979 年成立,总部在美国。是全球很厉害的数据仓库和企业级数据管理解决方案提供商。在全球有好多万家客户,各个行业都有。有很成熟的数据仓库技术,存和管理大量数据很在行。能处理 TB 级别的数据量,还能支持好几千个用户同时用。能帮企业建数据仓库,整合、分析数据还能出报告。比如在零售行业,能帮零售商分析销售数据,把库存管理得更好。数据主要是企业内部各种业务系统来的。每天能处理来自好几千个业务系统的数据。对用 Teradata 解决方案的企业员工来说,能因为更高效的数据管理和分析提高工作效率,但工作数据也可能被用来分析评估,有点压力。比如个人工作绩效可能被更严格地监控。
5、IBM
这可是大名鼎鼎的国际商业机器公司,1911 年就有了,总部在美国。是全球有名的信息技术公司,提供各种大数据和分析解决方案。在全球有好几十万名员工,给好多企业和政府机构服务。技术积累丰富,产品线也广,数据存储、处理、分析和人工智能这些领域都有涉及。能处理 EB 级别的数据量,用先进的分布式计算技术。给企业提供全面的大数据解决方案,像数据仓库、数据分析平台、人工智能应用这些。
比如在金融行业,能帮银行做风险评估和客户分析。数据可以从企业内部和外部各种数据源接入,包括结构化和非结构化数据。每天能处理来自好几百万个数据源的数据。IBM 的技术在好多地方都能用,可能影响个人生活和工作。比如在医疗领域,能帮医生更好地诊断疾病,给个人更好的医疗服务。但个人信息也可能被收集分析,让人担心隐私问题。比如个人健康数据可能被用来做医学研究。
6、Oracle
甲骨文公司,1977 年成立,总部在美国。是全球领先的企业级软件和数据库提供商。在全球有好多万家客户,各个行业都有。以强大的数据库技术为基础,提供全面的数据管理和分析解决方案。能处理 TB 级别的数据量,支持好几千个用户同时用。能帮企业存数据、管理数据、分析数据还能出报告。比如在制造业,能帮企业分析生产数据,提高生产效率。数据主要是企业内部业务系统和数据库来的,也能接入外部数据源。每天能处理来自好几千个业务系统的数据。在企业里,这技术能提高数据管理和分析效率,给个人带来更好的产品和服务。但个人信息可能被企业收集分析用来营销,让人担心隐私问题。比如个人消费数据可能被用来做个性化推荐。
7、Dataiku
总部在法国巴黎,是个基于云技术的数据服务平台。给企业客户提供数据科学和机器学习平台,帮企业靠数据创新。在全球有好几千家客户,各个行业都有。提供的平台很好用,数据专家和不懂工程的人都能轻松用,能收集很多数据还能从分析中得到结果。能处理 GB 级别的数据量,支持多种数据分析和机器学习算法。能帮企业探索数据、建模、预测和优化。比如在电商行业,能帮电商企业分析用户行为,提高销售额。数据可以从企业内部和外部各种数据源接入,像数据库、文件系统、传感器这些。每天能处理来自好几千个数据源的数据。对企业里的数据分析师和业务人员来说,这平台能提高工作效率和数据分析能力,给个人职业发展带来机会。但个人工作数据也可能被用来分析评估,有点压力。比如个人工作绩效可能被更准确地评估。
8、Snowflake
2012 年成立,总部在美国。是家基于云的数据仓库公司,提供又快又灵活还能扩展的数据存储和分析服务。在全球有好几千家客户,各个行业都有。用独特的云原生架构,把数据存储和计算分开了,性能和可扩展性都提高了。能处理 PB 级别的数据量,支持好几千个用户同时用。能帮企业在云计算环境里存很多数据、分析数据,还能做实时数据分析和机器学习这些高级应用。比如在金融科技领域,能帮金融科技公司分析用户数据,提供个性化金融服务。数据可以从企业内部和外部各种数据源接入,像数据库、文件系统、传感器这些。每天能处理来自好几千个数据源的数据。这技术能给企业提供高效的数据存储和分析服务,可能给个人带来更好的产品和服务。但在云计算环境里,个人数据可能面临更多安全风险。比如个人云存储数据可能被黑客攻击。
9、ThoughtSpot
2012 年成立,总部在美国。提供智能数据分析平台,让企业用户能很快很直观地得到数据洞察。在全球有好几千家客户,各个行业都有。用搜索式的分析界面,用户提个问题就能得到准确答案。能处理 GB 级别的数据量,支持多种数据源接入。能帮企业做数据分析和决策支持,提供实时的数据可视化和报告功能。比如在能源行业,能帮能源企业分析能源消耗数据,提高能源效率。数据可以从企业内部和外部各种数据源接入,像数据库、文件系统、传感器这些。每天能处理来自好几千个数据源的数据。对企业里的业务人员和决策者来说,这平台能提高他们的数据分析能力和决策效率,给个人工作带来便利。但个人行为数据也可能被收集分析用来做企业决策,让人担心隐私问题。比如个人工作习惯可能被用来优化工作流程。
10、Jadak(ThingMagic)
ThingMagic 是 Jadak 旗下的品牌,起源于美国麻省理工学院自动识别中心,是全球 RFID 行业的老大。提供先进的 RFID 读写器这些数据采集设备和解决方案。在全球有好几千家客户,各个行业都有。有很先进的 RFID 技术,读和写 RFID 标签里的数据又快又准。几秒钟就能读好几千个 RFID 标签,准确率能有 99% 以上。能帮企业做供应链管理、资产跟踪、库存管理这些。比如在物流行业,能帮物流公司随时知道货物位置,提高物流效率。数据主要是 RFID 标签里的,还有跟 RFID 系统集成的其他数据源。每天能处理来自好几百万个 RFID 标签的数据。在供应链管理这些领域,这技术能提高物流效率和库存管理水平,可能给个人带来更快的商品配送和更好的购物体验。但 RFID 技术也可能让人担心隐私问题,比如个人购物行为可能被跟踪分析。比如个人购物记录可能被商家用来精准营销