1
一句话了解DTinsight.Science
DTinsight.Science是「可视化建模与交互式代码编写于一体的机器学习作业探索平台」,实现数据接入、可视化实验建模、Notebook编程、模型训练、模型部署、任务运维等开发场景,帮助企业构建算法服务能力,提供高效、安全、稳定的算法运行环境。
使用数栈-数据科学平台DTinsight.Science
进行一站式数据探索
划重点!
数栈-数据科学平台DTinsight.Science是什么:机器学习作业探索平台
数栈-数据科学平台DTinsight.Science的产品目标是:提供专业、可靠、高效的算法建模平台,一站式完成算法建模、模型训练、模型部署等机器学习作业,让数据智能触手可及。
数栈-数据科学平台DTinsight.Science的客户价值是:帮助企业构建算法服务能力,让数据智能快速落地,构建数据智能化与业务智能化双向驱动引擎。
数栈-数据科学平台DTinsight.Science给谁用:企业的数据科学家和数据分析师们
2
再深入了解DTinsight.Science
2.1研发初衷
随着大数据在企业中横向与纵向的深度应用,已经有离线计算、实时计算等大数据产品解决客户常用的计算与运维场景。目前,数据的智能化应用也是更多企业应用、探索的方向,让数据智能驱动业务智能。在这个过程中,怎么让更多的企业快速拥有数据智能化的能力,是数据科学平台思考的方向。
所以今天,数栈推出数据科学平台来构建数据加工后的算法建模能力,为数据科学家数据分析师提供完善易用的开发平台,希望为企业提供更加科学、准确的判断,实现数据的高价值应用。
2.2产品优势
#兼容主流机器学习与深度学习框架#
TensorFlow\MXNet\Python\Spark
数栈-数据科学平台DTinsight.Science目前支持TensorFlow、MXNet、Python、Spark计算框架,不同的算法任务可选择合适的计算框架,支持多维化开发场景。后续也将支持Pytorch、XGboost等计算框架。
#丰富的算法组件库#
你需要的组件,我都会有
数栈-数据科学平台DTinsight.Science封装了多类算法组件,包含数据源/目标、SQL脚本工具、数据预处理、特征工程、统计分析、机器学习、深度学习、预测、评估、文本分析、网络分析等算法组件,充分覆盖算法建模场景。
DTinsight.Science具有丰富的算法组件
#可视化实验建模#
可视化、拖拉拽方式进行算法建模
在大数据深度应用的现在,越来越多的人员对数据与业务的智能结合,算法模型搭建充满兴趣。数栈-数据科学平台DTinsight.Science支持可视化实验建模,可将算法组件拖拉拽至画布区域,组成可视化的实验流,可界面化配置组件参数,并可视化查看数据运行结果以及模型结果,简单易上手。
DTinsight.Science支持可视化实验建模
#交互式Notebook数据探索#
使用Python自由进行数据探索
除可视化的实验搭建外,数据科学平台同时具备交互式Notebook开发环境,可进行python代码的编写,执行某段语句查看相应结果与运行日志,为数据分析师提供自由的数据探索环境。
交互式Notebook自由进行数据探索
#模型离线训练#
周期调度,训练模型参数
算法模型开发完成后,可提交任务进行离线调度,调度引擎根据调度周期进行模型训练,产生新的模型参数与数据。模型训练完成后,可查看评估结果,选取合适的模型参数进行保存应用,或在线部署。
#模型在线部署#
模型在线部署和调用,实时挖掘数据价值
当模型的预测及评估结果达到目标后,可进行模型在线部署,将模型部署至模型服务器上,并生成模型的调用API。部署后,可进行模型的在线调用。
除以上核心功能外,基础的租户隔离、项目创建管理、用户管理、角色管理、数据接入等也是具备的,可一站式完成机器学习作业,欢迎大家体验。
3
使用DTinsight.Science可以
做哪些有意思和有价值的事情?
数栈-数据科学平台DTinsight.Science可帮助企业构建算法服务能力,服务于企业数据的多样化应用场景,驱动业务创新发展。常用的应用场景如下:
基于相关数据进行个性化的商品推荐、视频推荐、旅游商品推荐、广告精准投放等。
精准营销
分析用户关系网络,进行人群关联,精细化任务画像,扩大营销范围及场景。
关系网络
分析销售与库存关系,帮助企业智能化进货、退货,合理使用库存控件,并保证健康的供应链关系。
库存优化
利用整体的销售数据,以及单品历史销售数据,可进行单品未来的销售预测,合理的指导门店销售及铺货。
销售预测
金融领域是算法模型应用比较成熟的领域,应用的场景也很多,比如根据个人信用评估,进行贷款发放的预测,贷款还款的预测,进行风险控制,以及屏蔽羊毛*等营销场景上的使用。
金融风控
在不同的行业领域,会有更多的分析场景,如文本分析、图片分类、视频分析等。
其他
截止到今天,袋鼠云企业级一站式数据中台PaaS-数栈具有数据计算引擎、数据开发平台、数据科学平台、数据资产平台、数据服务引擎等5大产品模块,平台覆盖全链路的数据采集、数据分析、数据挖掘、任务运维、数据质量、数据地图、数据模型、数据API开放等场景,充分满足企业建设数据中台过程中的多样复杂需求。
目前,西湖风景名胜区、西溪湿地、山西商务厅、老板电器、中金易云、河南世纪联华、浙江大学、常州旅游商贸职业技术学校、宁波图书馆、京东方、福建票付通、观远数据、东方龙马、佰羚数据等客户和合作伙伴都已经在使用或者参与数栈产品共创。
数栈
企业级—站式数据中台PaaS
数据计算引擎
提升企业数据共享能力,加速释放数据价值
离线计算引擎
基于ApacheSpark,计算速度比MapReduce快百倍
实时计算引擎
基于ApacheFlink,高吞吐、低延迟、高性能
数据开发平台
一站式大数据开发平台,快速完全数据中台搭建
离线计算开发套件
节省80%数据开发时间,全链路数据处理,兼容开源、商用计算引擎
实时计算开发套件
金融级流式数据处理自研组件,10倍采集性能,Flink引擎源码增强
数据同步引擎FlinkX
分布式多节点并发读写,吞吐量高,支持丰富的数据源
数据科学平台
机器学习作业探索平台
可视化实验搭建,集成多种主流计算框架与丰富的算法组件
交互式Notebook开发,提供自由的算法探索环境
模型离线训练,支持周期调度与任务管理
模型在线部署,支持在线调用模型与更新模型版本
数据资产平台
构建企业数据资产中心,实现数据管理规范化
数据地图
可视化数据资产中心,数据全生命周期可知可管
数据质量
覆盖90%质量校验场景,双表逐行校验保障海量数据一致
数据模型
构建OneData数据模型,快速上手清晰易懂的数据规范
数据服务引擎
提升企业数据共享能力,加速释放数据价值
数据可视化
让数据价值看得见,打造新一代“四有”大屏
分析引擎
百亿数据实现秒级查询多维度,频度复杂分析
数据API
“0代码”API生成,多权限控制保障数据开放安全
想要了解更多DT.Science及数栈?
欢迎扫描下方