-
邀请演讲您好,感谢您的关注和支持。大数据"杀熟"的实质是平台方利用所掌握的海量数据对用户需求做出精准分析,以达到"不同用户不同定价"的目的,从而使自己的利益最大化。这个过程中,从数据采集、数据存储、数据处理到数据分析,都涉及到方方面面的前沿技术。数据采集与预处理由于数据经常有着不同的来源,需要对数据做进一步集成处理或整合处理,将来自不同数据集的数据收集、整理、清洗、转换后,生成到一个新的数据集,为后续查询和分析处理提供统一的数据视图。所用工具有Data Flux、Data Stage及Informatica Power Center等。数据存储与管理传统的数据存储和管理以结构化数据为主,而大数据往往是半结构化和非结构化数据为主、结构化数据为辅,需要对不同类型的数据内容检索、交叉比对、深度挖掘与综合分析。MPP(Massive Parallel Processing)分布式计算模式可以管理大规模结构化数据,Hadoop则可以实现对半结构化和非结构化数据的处理。大数据计算大数据计算模式,即根据大数据的不同数据特征和计算特征,从多样性的大数据计算问题和需求中提炼并建立的各种高层抽象(abstraction)或模型(model)。典型的大数据计算模式包括迭代计算、批处理计算、内存计算、流式计算(Spark Streaming)、数据查询分析计算(Shark)以及图计算(GraphX)等。大数据分析对大数据的深度分析主要基于大规模的机器学习技术,由于基于机器学习的大数据分析具有迭代性、容错性、参数收敛的非均匀性等特点,直接应用传统的分布式计算系统应用于大数据分析,很大比例的资源都浪费在通信、等待、协调等非有效的计算上。研究人员开发了一系列接口简单容错性强的分布式计算框架服务于大数据分析算法,以MapReduce、Spark和参数服务器ParameterServer等为代表。大数据可视化可视化通过交互式视觉表现的方式来帮助人们探索和理解复杂的数据。大规模数据的可视化主要是基于并行算法设计的技术,结合多分辨率表示等方法,主要涉及数据流线化、任务并行化、管道并行化和数据并行化4 种基本技术。微软的大规模机器学习可视化平台(Azure Machine Learning)、阿里巴巴旗下的大数据分析平台御膳房都是互动式大数据分析平台的案例。
-
易鑫集团2023年年报:新能源车融资交易量同比增长206%至11.6万台
2月29日,易鑫集团(HK.2858,以下简称“易鑫”)披露年报,展现了其在新能源车业务上的高速成长。公告数据显示,2023年易鑫新能源车融资交易量同比增长206%,至11.6万台,融资交易金额达到124亿元,同比增长200%。 新能源车已是汽车产业发展重点。根据乘用车市场信息联席会数据,2023年国内新能源汽车零售销量为774万辆,同比增长36%。作为一家专业的汽车金融交易平台,易鑫数年前即开始前瞻性布局新能源车这一高潜力业务。从去年数据来看,不仅在相关交易量和交易额上取得高速增长,新能源车融资额在其新车业务中的占比亦持续上升,2023年下半年达到33%。

扫一扫
下载《前瞻经济学人APP》进行提问
与资深行业研究员/经济学家互动交流让您成为更懂行业的人