spark dataframe读取特征报错的问题

val fileword =sc.textFile(path,1)

.map(x=>(x.split(",")(2152),Vectors.dense(x.split(",").map(_.toDouble).toList.take(2151).toArray)))

fileword.sample(false,0.1,2).foreach(println)

valschema =StructType(

StructField("label",StringType)

::StructField("features",VectorType)

::Nil

)//定义字段名称和格式

valrowRDD = fileword.map(p=>Row(p._1,p._2))//对rdd记录进行转换

valwordsDataFrame =sqlContext.createDataFrame(rowRDD,schema)//生成dataframe

wordsDataFrame.show(100)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容