1、spark dataframe是一种以 RDD 为基础的分布式数据集,是一种特殊的RDD,是一个分布式的表,类似于传统数据库中的二维表格。
2、spark dataframe与RDD的主要区别在于,前者带有schema元信息,即spark dataframe所表示的二维表数据集的每一列都带有名称和类型。
原创 | 2023-03-01 14:09:02 |浏览:1.6万
1、spark dataframe是一种以 RDD 为基础的分布式数据集,是一种特殊的RDD,是一个分布式的表,类似于传统数据库中的二维表格。
2、spark dataframe与RDD的主要区别在于,前者带有schema元信息,即spark dataframe所表示的二维表数据集的每一列都带有名称和类型。
Copyright 2005-2020 www.kxting.com 版权所有 | 湘ICP备2023022655号
声明: 本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:47085,1089@qq.com