专家说不要单独做大数据分析

一名分析专家表示,从跳板上跳入大数据池不一定是一份孤独的工作。

“不要单独行动,”加拿大健康信息公司(Canada Health Infoway)新兴技术团队的架构总监亚历克斯·梅尔(Alex Mair)周四在多伦多举行的大数据会议上说。“有很多合作和成功的机会。”

Infoway是一家非盈利机构,为省级政府提供数据共享架构方面的建议。Mair在一次采访中说,虽然它的建议可能在卫生等部门更有意义,但它确实适用于没有大型it部门的企业。

Mair曾在私营部门和公共部门从事分析工作,他说组织需要在开始之前了解大数据分析可能意味着什么。

他说:“你需要找到能为我提供价值的用例。”然后问“我要如何衡量它,以便我可以开发一个未来的商业案例?”

与所有大型项目一样,他也敦促那些有兴趣的人在组织中寻找愿意支持它的高级人员。

大数据——一些人将其定义为比传统分析软件处理的数据更多,而另一些人,如Mair,将其定义为处理非结构化的、接近实时的数据——提供了一种可能性,可以更深入地了解客户的意图,并可能预测未来。

大会上的一位演讲者通过分析大数据来预测社交媒体的发展趋势。另一家刚刚推出了一款软件,可以预测哪些学生有失败的风险。

此次会议吸引了众多公共和私营部门的分析师,他们希望更多地了解如何处理海量数据。

与会者包括安大略省工作场所安全与保险委员会(Workplace Safety and Insurance Board)副总裁兼首席统计员尤金·温(Eugene Wen)博士,他在一次采访中表示,他希望更好地进行关键数据建模。

他说,这家向受伤工人支付赔偿金的机构拥有100年的数据,但没有使用先进的技术从数据中获得最大的好处。

泰朗斯福德,丹佛SendGrid高级商业情报分析员,开发人员所使用的电子邮件平台发送事务性的邮件在Web应用程序中,他承认部分是听到有竞争对手做演示,而且还学习如何分析可以更好地利用他的公司。

他说,自2009年以来,SendGrid已经发送了1,150亿封电子邮件。“有了这些数据,我们当然可以在分析方面做得更多”。

拥有公共卫生实验室的安大略省健康保护局(Ontario Agency for Health Protection)的数据库顾问米哈埃拉·斯莫奇纳(Mihaela Smochina)在那里学习其他人如何解决来自不同平台的数据集成问题,并提高预测能力。

他们和其他与会者得到的是来自加拿大和一些组织的简要案例研究。

总部位于多伦多的电子书零售商Kobo的大数据副总裁乔丹•克里斯滕森(Jordan Christensen)表示,他的公司去年决定利用读者搜索的大数据,帮助向买家提供推荐。

他们的策略来自IEEE杂志上的一篇文章,文章认为简单的模型和大型数据集胜过复杂的模型和较少的数据——这很有吸引力,因为Kobo只能组建一个5人的大数据分析团队。

此外,还决定该股应成为一个利润中心,至少从其建议中产生足够的收入来支付该司工作人员的费用。

网络旅游网站Expedia的数据工程师Arek Kaczmarek解释了该公司如何使用开源Hadoop框架来连接来自几个数据库的数百兆兆字节的数据。这使得分析师可以直接查询Hadoop,而不是创建单一用途的数据集市。为了提高查询速度,数据没有被规范化(即它包含数据的冗余副本)。

施乐公司(Xerox Inc.)的研究科学家拉卡什•库尔卡尼(Rakesh Kulkarni)讲述了他的公司如何为洛杉矶市创建了一种算法,该算法通过大量的停车数据,根据可用停车位的数量来设定该市每小时的停车价格。

整合了许多公司忠诚度计划的在线服务网站Points.com的首席数据科学家查鲁米特拉·普贾尔(Charumitra Pujar)表示,他的公司认为,大数据需要一种新的数据建模方式,这种方式不仅能让数据和业务团队紧密合作,还包括设置一个成功指标。

“大数据正在从根本上改变我们今天的决策方式,”他说。

“那些根据(传统)预测模型做出决策的营销人员和企业主现在面临挑战,因为他们有更多的可用信息。”

(0)
上一篇 2022年4月6日
下一篇 2022年4月6日

相关推荐