博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《Scala机器学习》一一1.7 总结
阅读量:6683 次
发布时间:2019-06-25

本文共 315 字,大约阅读时间需要 1 分钟。

1.7 总结

本章试图为后面更复杂的数据科学建立一个通用平台。不要认为这里介绍了一套完整的探索性技术,因为探索性技术可扩展到非常复杂的模式上。但是,本章已经涉及了简单的汇总、抽样、文件操作(如读和写),并使用notebook和Spark DataFrame等工具来工作,Spark的DataFrame也为使用Spark/Scala的数据分析师引入了他们所熟悉的SQL结构。
下一章开始介绍数据管道,可将其看作基于数据驱动企业的一部分,并从商业角度给出数据发现的过程:做数据分析试图要完成的最终目标是什么。在介绍更复杂的数据表示之前,会先介绍一点传统的机器学习内容,如监督学习和无监督学习,从中也能看出Scala相对于SQL的优势。

转载地址:http://cyoao.baihongyu.com/

你可能感兴趣的文章
Python基础之定义有默认参数的函数
查看>>
iOS5中的UUID
查看>>
(转载)XML Tutorial for iOS: How To Read and Write XML Documents with GDataXML
查看>>
poj 3259 Wormholes
查看>>
py学习之道
查看>>
o(1)复杂度之双边滤波算法的原理、流程、实现及效果。
查看>>
python中requests模块使用
查看>>
git bash 常用命令 新手学习
查看>>
最短路径
查看>>
POJ题目(转)
查看>>
day28 classmethod 装饰器
查看>>
QName
查看>>
Java使用线程并发库模拟弹夹装弹以及发射子弹的过程
查看>>
程序员找不女朋友的原因
查看>>
C#编程之“串口通讯多次接收”
查看>>
【python 文件操作】python 文件操作
查看>>
线程相关
查看>>
第十一次作业
查看>>
ubuntu 为rabbitmq安装web插件管理界面(为了远程查看rabbitmq) 分类...
查看>>
1.4 注册系统的逻辑与结构
查看>>