返回首页  设为首页  加入收藏  今天是:
网站首页科技手机智能科学时尚教育亲子艺术房产
相关文章
 15种常见的数据科学技术
 天水市科学技术协会 天水市教…
 海上壹周︱垃圾分类、科技创…
 迈润智能科技项目入选世界人…
 黑科技+垃圾分类 昌平区厨余…
 全民K歌丛书:夺卖货节冠军从…
 大卫鲍伊:玩转时尚与电影的…
 韩媒:陪同金正恩神秘女子或…
 2023中国童模榜中榜木兰精神…
 歌手丛书
 加快建设教育强国、科技强国…
 腾讯课堂战略升级的一小步推…
 回眸2012精彩教育语录盘点:…
 一本书变现的6种方式
 南溪山医院打造“五大课堂”…
 学抖音失手伤女儿 脊髓严重受…
 过年在海口怎么玩?这份春节…
 心自由教育骗局曝光?隔代育…
 亲子鉴定大概多少钱啊?亲子…
 人民医院亲子鉴定能做吗?做…
 一周观展指南|马蒂斯的马蒂…
 齐白石的“水墨江湖”如何让…
 “一花一世界”中日绘画交流…
 “文明的传承:以启山林--百…
 印象长白山·大美写生地 “艺…
 2020年全国重点50城租售比呈…
 70城房价上涨!都谁在买房?…
 诸葛找房:楼市“年中考”平…
 2020年9月深圳宝安区二手房房…
 丁祖昱:1月70城房价环比降势…
 多位院士助阵 “2023中国力量…
 有chatGPT我还需要学习吗?打…
 上证夜读│徐超:面朝大海向…
 牢记嘱托奋进美好时代ԉ…
 牢记嘱托奋进美好时代ԉ…
 紧急提醒!有人差点被骗160万…
 华为7月特惠 手机免费贴膜 换…
 为何华为手机国产化率高但价…
 华为7月服务日开启:手机免费…
 华为 7 月服务日开启:手机免…
 智慧团建系统申请转接关系网…
 2023年河北保定智慧团建初始…
 南阳智慧团建忘记密码了怎么…
 南阳共青团智慧团建官网入口
 智慧团建平台学社转接怎么操…
 美国富豪用儿子血浆“回春”…
 “智造”江湖武汉是个什么“…
 2023自然指数年度榜单发布 华…
 马斯克新女友曝光?Science子…
 吴立新院士领衔!中国海洋大…
专题栏目
网络
您现在的位置: tac新闻网 >> 科学 >> 正文
高级搜索
15种常见的数据科学技术
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/7/11 12:07:46 | 【字体:

  寸芒后传数据科学技术如今已在许多组织中占有一席之地,数据科学家正迅速成为以数据为中心的组织最受欢迎的角色之一。数据科学的应用程序利用机器学习等技术和大数据的力量来获取深入的见解和新的功能,其中包括预测分析、图像和对象识别、会话人工智能系统等。

  事实上,那些没有在数据科学上进行充分投资的组织可能很快落后于在数据科学方面获得显著竞争优势的竞争对手。

  数据科学家可以做些什么以提供这种变革性的业务收益?数据科学领域是一些关键要素的集合:准确提取可量化数据的统计和数学方法;使用先进的分析技术和方法从科学角度解决数据分析的技术和算法,有助于处理大型数据集;以及可以帮助将大量数据整理成获得高质量见解的所需格式的工具和方法。

  以下将更深入地研究数据科学家使用的常见统计和分析技术。其中一些数据科学技术植根于数世纪的数学和统计工作,而另一些技术则相对较新,利用了机器学习、深度学习和其他形式的高级分析的研究成果。

  当识别大量数据中的信息时,数据科学家首先需要辨别不同的数据元素如何相互关联。例如,如果在一张图上绘制了一堆数据点,那么如何知道它们是否有意义?

  数据科学家最广泛使用的有三种统计和分析技术。也许数据表示两个或多个变量之间的关系,而其工作是绘制某种最能描述这种关系的曲线或多维平面。或者,它代表具有某种亲和力的集群。其他数据可能代表不同的类别。通过发现这些关系,可以使数据的其他随机性具有意义,然后可以对其进行分析和可视化,以提供组织可以用来制定决策或计划策略的信息。

  在分类问题中,数据科学家要回答的首要问题是:“这些数据属于什么类别?”将数据分类的原因很多。也许数据是手绘的图像,人们需要知道图像代表什么字母或数字。或者代表贷款申请的数据,想知道它应该属于“已批准”还是“已拒绝”类别。其他分类可以集中在确定患者治疗方案或电子邮件是否是垃圾邮件。

  决策树。这些是分支逻辑结构,使用机器生成的参数和数值树将数据分类为已定义的类别。 贝叶斯分类器。利用概率的力量,贝叶斯分类器可以帮助将数据分为简单的类别。 支持向量机(SVM)。支持向量机的目标是绘制一条宽边距的曲线或平面,将数据分成不同的类别。 K-近邻算法。该技术使用一种简单的“惰性决策”方法,根据数据集中最邻近的类别来确定数据点应该属于哪个类别。 逻辑回归。尽管使用了分类技术,但它使用将数据拟合到一条线的想法来区分每一边的不同类别。这条线的形状使数据可以移至某个类别。 神经网络。这种方法使用训练有素的人工神经网络,尤其是具有多个隐藏层的深度学习网络。神经网络已经显示出强大的分类能力,其中包含大量的训练数据。

  如果不知道数据属于哪一类,而是想知道不同数据点之间的关系该怎么办?回归的主要思想是回答以下问题:“这个数据的预测值是多少?”一个简单的概念来自“均值回归”的统计概念,它可以是一个独立变量和一个因变量之间的直接回归,也可以是一个试图找到多个变量之间关系的多维回归。

  例如决策树支持向量机(SVM)和神经网络一些分类技术,也可以用来进行回归。此外,数据科学家可以使用的回归技术包括:

  线性回归。作为数据科学中应用最广泛的方法之一,这种方法试图根据两个变量之间的相关性找到最适合所分析数据的曲线。 套索回归。Lasso(套索)是“最小绝对收缩和选择算符”的缩写,是一种通过在最终模型中使用数据子集来提高线性回归模型预测准确性的技术。 多元回归。这涉及寻找适合可能包含多个变量的多维数据的线或平面的不同方法。

  另一组数据科学技术侧重于回答这样一个问题:“这些数据是如何分组的,不同的数据点属于哪些组?”数据科学家可以发现相关数据点的聚类,这些数据点具有共同的各种特征,从而在分析应用程序中产生有用的信息。

  K-均值聚类。K-均值算法确定数据集中的一定数量的聚类,并找到“质心”,以标识不同聚类的位置,并将数据点分配给最接近的聚类。 均值漂移聚类。另一种基于质心的聚类技术,它可以单独使用,也可以通过移动指定的质心来改进k-均值聚类。 DBSCAN。DBSCAN是“基于密度的带噪空间聚类算法DBSCAN”的缩写,是另一种发现聚类的技术,它使用一种更高级的方法来识别聚类的密度。 高斯混合模型。高斯混合模型通过使用高斯分布将数据分组在一起而不是将数据视为奇点来帮助找到聚类。 分层聚类。与决策树类似,这种技术使用层次化的分支方法来查找聚类。

  关联分析是一种相关但独立的技术。其背后的主要思想是找到描述不同数据点之间公共性的关联规则。与聚类类似,人们正在寻找数据所属的组。但是在这种情况下,试图确定何时数据点一起出现,而不是仅仅识别它们的集群。在聚类中,其目标是将大数据集划分为可识别的组,而通过关联分析,人们正在测量数据点之间的关联程度。

  数据科学工具带中的上述方法和技术需要适当地应用于特定的分析问题以及可用于解决这些问题的数据。优秀的数据科学家必须能够理解当前问题的本质是聚类、分类还是回归?以及在给定数据特征的情况下可以产生所需答案的最佳算法。这就是数据科学实际上是一个科学过程而不是具有严格规则的过程,并允许通过编程解决问题的原因。

  使用这些技术,数据科学家可以处理广泛的应用程序,其中许多应用程序通常出现在不同类型的行业和组织中。以下是一些例子:

  异常检测。如果可以找到预期或正常数据的模式,那么也可以找到那些不符合模式的数据点。金融服务、医疗保健、零售和制造业等行业组织经常采用各种数据科学方法来识别其数据中的异常情况,以用于欺诈检测、客户分析、网络安全和IT系统监控。异常检测还可以用来消除数据集中的异常值,以提高分析的准确性。 二分类和多分类。分类技术的一个主要应用是确定某物是否属于某一特定类别。这就是所谓的二分类,因为人们可能会问诸如“图片中是否有猫?”之类的问题。实际的业务应用是使用图像识别在大量文件中识别合同或发票。在多类分类中,在数据集中有许多不同的类别,正在努力寻找最适合数据点的类别。例如,美国劳工统计局会对工伤进行自动分类。 个性化。希望与客户进行个性化交互或向客户推荐产品和服务的组织首先需要将数据分组到具有共享特征的数据桶中。有效的数据科学工作可以使用推荐引擎和超个性化系统等技术,根据个人的具体需求和喜好量身来定制网站,推销产品及更多内容,这些技术是通过匹配人员详细资料中的数据来驱动的。

  这只是数据科学应用程序的一些示例。通过采用数据分析的各种工具和方法,数据科学家可以帮助使用它们的组织获得战略和竞争优势。

  每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

科学录入:admin    责任编辑:admin 
  • 上一个科学:

  • 下一个科学: 没有了
  •  
     栏目文章
    普通科学 15种常见的数据科学技术 (07-11)
    普通科学 天水市科学技术协会 天水市教育局关于举办第3… (07-11)
    普通科学 海上壹周︱垃圾分类、科技创新……5月上海市领… (07-11)
    普通科学 迈润智能科技项目入选世界人工智能大会重点产… (07-11)
    普通科学 黑科技+垃圾分类 昌平区厨余垃圾精细化管理有… (07-11)
    普通科学 美国富豪用儿子血浆“回春”?Secience:这种… (07-10)
    普通科学 “智造”江湖武汉是个什么“谷”? (07-10)
    普通科学 2023自然指数年度榜单发布 华大连续八年蝉联亚… (07-10)
    普通科学 马斯克新女友曝光?Science子刊:论造谣 AI比… (07-10)
    普通科学 吴立新院士领衔!中国海洋大学科研团队在多尺… (07-10)
    普通科学 促进科技成果转化 不让成果变“陈果”br——全… (07-09)
    普通科学 2014年华容县国民经济和社会发展统计公报 (07-09)
    普通科学 科学的昨天、今天和明天 (07-09)
    普通科学 “机器都会学习了孩子们要学什么怎么学?” (07-09)
    普通科学 外国政要、外国学者眼中的中国式现代化是什么… (07-09)
    普通科学 杂志征订倒计时:2023年1月起订杂志即将截止! (07-08)
    普通科学 【好刊】阅读接力培养牛娃这套百年经典的科普… (07-08)
    普通科学 清华大学教授颜宁:享受科学的纯粹与永生 (07-08)
    普通科学 双十一要给孩子囤的中文杂志都在这里了 (07-08)
    普通科学 冷冬书香沸腾 (07-08)