极品熟女 深度学习在大数据分析中的应用商量 Research of Deep Learning Applications in Big Data Analytics
大庆师范学院计较机科学与信息工夫学院极品熟女,黑龙江 大庆
收稿日历:2022年4月12日;拜托日历:2022年6月8日;发布日历:2022年6月15日
概要
金瓶梅在线深度学习算法通过分层学习进程索要高档、复杂的抽象行为数据示意。本文通过对现存深度学习在大数据分析中的所取得的效果,探讨了如何诈骗深度学习处分大数据分析中的一些典型问题,如从海量数据中索要复杂模式、语义索引、数据记号、快速信息检索及简化分手任务等问题,重心征询的是在音视频方面的应用情况。终末,就咫尺商量存在的问题对改日关联职责建议观点。
重要词
大数据,深度学习,数据示意,语义索引,分手任务
Research of Deep Learning Applications in Big Data Analytics
Meijuan Jia, Xin Li, Liang Kong, Chun Liu, Guoqiang Shao
College of Computer Science and Information Technology, Daqing Normal University, Daqing Heilongjiang
Received: Apr. 12th, 2022; accepted: Jun. 8th, 2022; published: Jun. 15th, 2022
ABSTRACT
Deep Learning Algorithm extracts high-level and complex abstractions as data representation through hierarchical learning process. Based on the achievements of existing Deep Learning in big data analysis, this paper discusses how to use Deep Learning to solve some typical problems in big data analysis, such as extracting complex patterns from massive data, semantic indexing, data labeling, fast information retrieval and simplifying differentiated tasks. The focus is on the application in audio and video. Finally, some opinions on the future related work are put forward based on the problems existing in the current research.
Keywords:Big Data, Deep Learning, Data Representation, Semantic Index, Discriminative Task
Copyright © 2022 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
1. 小序
当代数据密集型工夫以及加多的计较和数据存储资源对大数据科学的发展作念出了要紧孝顺 [1]。谷歌、雅虎、微软和亚马逊等基于工夫的公司如故采集并爱戴了以EB或更大比例掂量的数据,而Facebook、YouTube和Twitter等搪塞媒体组织领少见十亿用户,咫尺仍然在不停生成多数数据。大数据代表了用于应用领域的问题和工夫,这些应用领域采集和爱戴多数原始数据,用于特定领域的数据分析。从海量输入数据中挖掘和索要特兴味兴味的模式,用于决策、预测和其他预计,是大数据分析的中枢。除了分析海量数据外,大数据分析还为机器学习和数据分析带来了新的挑战,如原始数据的形貌变化、快速转移的流式数据、数据分析确切切度、高度溜达的输入源、嘈杂和低质地的数据、高维性、算法的可扩张性、不屈衡的输入数据、无监督和未分类的数据、有限的监督/记号数据等。此外,大数据分析还波及到充分的数据存储、数据索引/记号和快速信息检索等重要问题。因此,在处理大数据时,需要立异的数据分析和数据管清楚决决议。
本文主要征询深度学习如何匡助处分大数据分析中的特定问题,这包括从海量数据中学习、语义索引、分手性任务和数据记号等。详情在大数据分析的深度学习方面需要立异的热切改日领域。
2. 数据挖掘和机器学习中的深度学习
深度学习算法中一个热切的意见是自动从数据中索要示意(抽象) [2] [3] [4]。即使用多数无监督数据自动索要复杂示意。这些算法主要受东说念主工智能领域的激动,其总体指标是模拟东说念主脑的不雅察、分析、学习和决策才略,稀少是关于极其复杂的问题,该算法勤勉师法东说念主脑的分层学习步调。当试图从输入语料库中的复杂结构和联系中索要有用信息时,基于浅层学习体系缚构(如决策树、解救向量机和基于案例的推理)的模子可能会失败。比拟之下,深度学习体系缚构好像以非局部和全局的方式进行详细,在数据中生成突出隔壁的学习模式和联系 [5]。事实上,深度学习是迈向东说念主工智能的热切一步。它不仅提供了适用于东说念主工智能任务的复杂数据示意,而且使机器寂然于东说念主类学问。
深度学习步调的另一个重要意见是数据的溜达式示意。数据溜达式好像为输入数据的抽象特征进行多数可能的建立,而且允许每个样本的紧凑示意。不雅察到的数据是通过几个已知/未知身分的互相作用生成的,因此,当通过学习身分的一些建立取得数据模式时,可能融会过学习身分和模式的新建立来描绘特地的数据模式 [2] [3]。与基于局部泛化的学习比拟,使用溜达式示意不错取得的模式数目跟着学习因子的数目快速加多。
东说念主工智能关联任务中使用的信得过数据大多来自多个源的复杂交互。举例图像是由灯光、对象体式和对象材质等不同的变化源组成,而深度学习算法提供的抽象示意不错对数据变化的不同起首进行分离。深度学习算法实质上是连气儿层的深层架构,每一层对其输入进行非线性变换,并输出其示意。近似非线性变换层是深度学习算法的基本念念想,数据在深层架构中经过的档次越多,构建的非线性调度就越复杂。不错将深度学习视为示意学习算法的特例,该算法在具有多个示意档次的深度体系缚构中学习数据的示意,其已毕的最终示意是输入数据的高度非线性函数。
3. 大数据分析
数据存储才略、计较处理才略的栽种以及数据量的飞速加多促进了大数据时期的到来。如斯大的数据量亦然大数据的一个主要积极特征。很多公司,如Facebook、雅虎、谷歌,如故领有多数数据,而且最近驱动诈骗其上风 [1]。一般兴味兴味上的大数据无间指逾越传统数据库和数据分析工夫的典型存储、处理和计较才略的数据。无法照看的多数数据对传统计较环境组成了径直挑战,行为一种资源,大数据不仅需要好像从大范围数据均分析和索要模式的用具和步调,还需要可扩张存储和溜达式战术来进行数据查询和分析。
大数据系统原始数据越来越各样化和复杂,主要由未分类/未监督的数据以及极少分类/监督的数据组成。系统需要对给定存储中各样数据示意神色的各样性进行处理,这给大数据带来了私有的挑战。除了赫然的海量数据外,大数据还与其他特定的复杂性关联,如容量、各样性、速率和准确性等 [6] [7] [8]。因此大数据系统需要对非结构化数据进行大数据预处理,以便索要结构化/有序示意神色,为后续商量者或者猝然者使用。
在现在的数据密集型工夫时期,数据速率——即数据采集和获取的增长率,与大数据的数目和各样性特征不异热切。咫尺,一些大型搪塞平台如Twitter、Yahoo等如故开垦了用于流式数据分析的家具 [6]。无间情况下固然对流式数据不立即进行处理和分析可能会丢失数据,但不错领受将快速转移的数据保存到大容量存储中,以便捷稍后进行批处理。可是,处理与大数据关联的速率的实质热切性在于响应回路的快速性,行将数据输入调度为可用信息的进程。这关于时间明锐的信息处理尤其热切。大数据的准确性波及数据分析扫尾确切切度或有用性,跟着数据源和数据类型数目的加多,守护对大数据分析的信任亦然一个实质挑战。
大数据分析面对着很多挑战,重要问题领域包括:数据质地和考证、数据算帐、功能工程、高维性和数据缩减、数据示意和溜达式数据源、数据采样,算法的可扩张性、数据可视化、并行和溜达式数据处理、及时刻析和决策、众包和语义输入,以矫正数据分析、追踪和分析数据起首、数据发现和集成、并行和溜达式计较、探索性数据分析息争释,整合异构数据,开垦新的海量数据计较模子。
4. 深度学习在大数据分析中的应用
如前所述,深度学习算法通过使用分层多级学习步调索要原始数据特兴味兴味的抽象示意。在分层多级学习步调中,高档别具有更抽象和更复杂示意,这是基于学习档次中的较初级别不太抽象的意见和示意来学习的。固然深度学习不错应用于从富饶大数目的记号数据中学习,但它主要故意于从多数未记号/无监督数据中学习 [2] [4] [5],从而故意于从大数据中索要特兴味兴味的示意和模式。
一朝通过深度学习从无监督数据中学习分层数据抽象,就不错借助相对较少的监督/记号数据点来考研更传统的判别模子,其中记号数据无间通过东说念主工或群众输入取得。与相对较浅的学习架构比拟,深度学习算法在索要数据中的非局部和全局联系及模式方面发达得更好 [5]。通过深度学习好像取得的抽象示意的其他有用特征包括:1) 相对爽脆的线性模子不错有用地处理从更复杂和更抽象的数据示意中取得的学问;2) 从无监督数据中索要数据示意的自动化进度栽种,使其好像庸俗应用于不同的数据类型,如图像、纹理、音频等;3) 不错在原始数据的更高抽象和示意级别上取得联系和语义学问。尽管基于深度学习的数据示意还有其他有用的方面,但上述特定特征关于大数据分析尤其热切。
从大数据的四个特征——容量、各样性、速率和准确性琢磨,深度学习算法和体系缚构更稳妥处分与大数据分析的容量和各样性关联的问题。深度学习诈骗了海量数据的可用性,即大数据中的海量数据,在大数据中,具有浅层学习档次结构的算法无法探索和清楚数据模式的更高复杂性。此外,由于深度学习波及数据抽象和示意,因此它很可能稳妥于分析以不不异子或来自不同起首的原始数据,即大数据的各样性,而且不错最大扫尾地减少对群众输入的需求,从而对大数据中的每种新数据类型进行特征索要。固然大数据分析为更传统的数据分析步调带来了不同的挑战,但同期它也为处分与大数据关联的特定问题的新算法和模子提供了热切契机。深度学习意见为数据分析群众和从业者提供了处分决议的方位。举例,通过深度学习索要的示意不错被视为决策、语义索引、信息检索以及大数据分析中的其他用途的实用学问起首。此外,当复杂数据以更高的抽象神色示意时,不错琢磨使用爽脆的线性建模工夫进行大数据分析。
深度学习算法和体系缚构领域如故完成了一些热切职责,包括语义索引、分手性任务和数据记号。本文通过商量诈骗深度学习进行大数据开垦诈骗的已有用果,了解到深度学习工夫在大数据分析中的新颖适用性,稀少是文献中的一些应用领域波及大范围数据。深度学习算法适用于不同类型的输入数据,本节咱们将重心先容它在图像、文本和音频数据上的应用。
4.1. 语义索引
与大数据分析关联的一项重要任务是信息检索 [1]。在搪塞汇集、安全系统、购物和营销系统、闪耀系统、欺骗检测和汇集流量监控等领域,需要采集和提供包括文本、图像、视频和音频等多数异构数据,而以往的信息存储、检索战术和处分决议王人受到大数据时期产生的海量数据和不同数据示意的挑战,因此信息的高效存储和检索是大数据中日益严重的问题。在上述这些系统中,无间是诈骗语义索引取得大数据而不是通过存储为数据位的字符串而取得。语义索引以更高效的方式呈现数据,并使其成为学问发现和清楚的有用起首,举例使搜索引擎提供更快、更高效地职责。大数据不再使用原始输入进行数据索引,而是使用深度学习生成的高档抽象数据示意,这些抽象数据示意即为大数据作事的语义索引。这些示意不错揭示复杂的关联和身分(稀少是当原始输入是大数据时),从而产生语义学问和清楚。
数据示意在数据索引中起着热切作用,举例,允许具有相对相似示意的数据点或实例存储在相互更近的内存中,从而有助于高效的信息检索。可是,应该肃肃的是,高档抽象数据示意需要特兴味兴味,并阐述联系和语义关联,以便更好地提供实质的语义清楚和对输入的清楚。
固然深度学习有助于提供对数据的语义和联系的清楚,但数据实例的向量示意(对应于索要的示意)将提供更快的搜索和信息检索。更具体地说,由于学习到的复杂数据示意包含语义和联系信息,而不单是是原始数据,因此当每个数据点(举例给定文本文档)由向量示意示意时,它们不错径直用于语义索引,允许基于向量的比较,这比径直基于原始数据比较实例更有用。具有相似向量示意的数据实例可能具有相似的语义。因此,在大数据分析中好像使用复杂高层数据抽象的向量示意对数据进行索引,即已毕语义索引。在本节的其余部分将重心先容基于深度学习取得的学问的文档索引。
基于从深度学习中取得的数据示意的索引的一般念念想不错扩张到其他神色的数据。文档示意是很多领域信息检索的一个重要方面。文档示意法的指标是创建一种示意法,以浓缩文档的特定和私有方面,举例文档主题。文档检索和分类系统主要基于字数,示意每个单词在文档中出现的次数。各样文档检索模式王人使用这种战术,举例TF-IDF [9] 和BM25 [10]。这么的文档示意模式把单个单词认定为维度,且不同维度是寂然的。在履行中单词的出现是高度关联的。使用深度学习工夫索要特兴味兴味的数据示意不错从高维文本数据中获取语义特征,反过来也会缩小文档数据示意的维度。
Hinton等东说念主描绘了一种用于学习文档二进制代码的深度学习生成模子 [11]。该模子中,深度学习汇集的最低层示意文档的字数向量,该向量行为高维数据,而最高层示意文档的学习二进制代码,且使用128位代码。该文献阐述了语义相似的文档的二进制代码在汉明空间中相对较近,而且文档的二进制代码可用于信息检索。关于每个查询文档计较其与数据中系数其他文档的汉明距离,并检索前D个类似文档。二进制代码需要的存储空间相对较少,而且使用诸如快速比特计数等算法计较两个二进制代码之间的汉明距离,这么不错已毕二进制代码相对较快的搜索。文献得出如下论断:用这些二进制代码进行文档检索比基于语义的分析更准确、更快。
深度学习生成模子还不错通过强制学习档次结构中的最高层使用相对较少的变量来生成较短的二进制代码,这些较短的二进制代码不错爽脆地用作内存地址。一个单词的内存用于描绘一个文档,这么,围绕该内存地址的小汉明球包含语义相似的文档——这种工夫称为“语义哈希” [12]。使用这种战术不错对稀少大的文档集推论信息检索,且检索时间与文档集大小无关。语义哈希等工夫关于信息检索稀少有眩惑力,不错通过查找与查询文档的内存地址收支几位的系数内存地址来检索与查询文档相似的文档。文献阐述了“内存散列”比局部明锐散列快得多,而局部明锐散列是现存算法中速率最快的步调之一。此外,通过向TF-IDF等算法提供文档的二进制代码而不是提供系数这个词文档,不错已毕更高档别的准确性。固然深度学习生成模子在生成用于文档检索的二进制代码方面的学习(或称之为考研)时间相对较慢,但由此产生的学问会产生快速预计,这是大数据分析的一个主要指标。更具体地说,为一个新文档生成二进制代码只需要进行一些向量矩阵计较,通过深度学习汇集体系缚构的编码器组件推论前馈传递。
为了更好地学习示意和抽象,不错使用一些有监督的数据来考研深度学习模子。Ranzato等东说念主在文献 [13] 中建议基于监督和非监督数据学习好像取得深度学习模子的参数。这种战术的优点是不需要透澈记号多数数据(如预期的一些未记号数据),而且模子具有一些先验学问(通过监督数据)来拿获数据中的关联标签信息。换句话说,除了提供文档类标签的致密预测外,模子还需要学习好像生成致密输入重构的数据示意。文献标明:关于学习紧凑示意,深度学习模子优于浅层学习模子。紧凑示意是有用的,因为在索引中使用它们时需要较少的计较,除此除外,天然还需要较少的存储容量。
谷歌的“word2vec”用具是一种不错从大数据中自动索要语义示意的用具。该用具以大范围文本语料库为输入,生成的词向量行为输出。它最初从考研文本数据构造词汇表,然后学习单词的向量示意,在此基础上,单词向量文献不错行为很多天然言语处理(Natural Language Processing, NLP)和机器学习应用步调的特征。Miklov等东说念主诈骗东说念主工神经汇集学习单词的溜达式示意 [14],好像从包含数亿个单词和数百万个不同单词的深广数据迷惑学习高质地单词向量。Dean J等东说念主在大范围溜达式框架“DistFalse”上已毕了深广的数据集上的考研汇集 [15]。在多数数据上考研的词向量走漏了词之间神秘的语义联系,举例城市和它所属的国度——举例,巴黎属于法国,柏林属于德国。具有这种语义联系的词向量可用于矫正很多现存NLP应用,如机器翻译、信息检索和问题恢复系统。举例,Miklov等东说念主演示了word2vec如何应用于天然言语翻译 [16]。
与文本数据类似,深度学习不错用于其他类型的数据,从输入语料库中索要语义示意,从而为该数据设立语义索引。但是深度学习的出现相对较晚,是以若使用分层学习战术行为大数据语义索引步调,还需要作念多数的职责。此外,当试图索要数据示意以进行索引时,使用什么尺度来界说“相似”也一个急需要处分的问题。
4.2. 分手性任务
诈骗大数据分析工夫进行分手时,不错使用深度学习算法从原始数据中索要复杂的非线性特征,然后将使用爽脆线性模子索要出的特征行为输入来推论分手任务。 这种步调有两个优点:1) 通过深度学习索要特征为数据分析加多了非线性,将分手性任务与东说念主工智能致密关联;2) 对索要的特征应用相对爽脆的线性分析模子,计较遵守更高,这关于大数据分析稀少热切。因此,从多数输入数据中不错开垦非线性特征,使数据分析好像把学到的学问应用于更爽脆的线性模子,从而进行进一步分析,最终已毕从多数数据中可用的学问中受益。这是在大数据分析中使用深度学习的一个热切平正,允许从业者通过使用更爽脆的模子来完成与东说念主工智能关联的复杂任务,举例图像清楚、图像中的物体识别等。因此,在深度学习算法的匡助下,大数据分析中的判别性任务相对容易。
分手性分析是大数据分析的主要目的之一,同期也不错通过推论判别性分析对数据进行记号,从辛勤毕搜索。Li等东说念主探索已毕的微软商量音视频检索系统(Microsoft Research Audio Video Indexing System, MAVIS)使用基于深度学习的语音识别工夫对语音和视频文献进行搜索 [17]。为了将数字音频和视频信号调度为笔墨,MAVIS会自动生成顽固的字幕和重要字,以加多对语音内容音频和视频文献的可造访性和发现性。
4.3. 语义标注
连年来互联网的发展和在线用户的爆炸式增长促进了数字图像储藏的范围飞速增长。数字图像的信息起首主要有搪塞汇集、宇宙定位卫星、图像分享系统、医疗成像系统、军事监控和安全系统等。谷歌探索开垦了提供图像搜索的系统,如谷歌图像搜索作事,包括仅基于图像文献名和文档内容的搜索系统,而不琢磨波及图像内容自己 [18] [19]。图像的文本示意并不老是在大范围图像采集库中可用,为了好像诈骗东说念主工智能对图像进行搜索,商量者应该突出图像的文本联系,且尽可能地采集和组织这些海量图像数据,以便好像更高效地浏览、搜索和检索这些数据。为了处理大范围的图像数据采集,一种步调是自动记号图像的进程,并从图像中索要语义信息。深度学习为构建图像和视频数据的复杂示意提供了新的前沿领域,行为相对较高的抽象级别,可用于图像谛视和记号,这对图像索引和检索稀少有用。由此可知,在大数据分析的配景下,深度学习将有助于分手数据的语义记号任务。
数据记号是与语义索引不同的意见,它是对输入数据语料库进行语义索引的另一种步调。在语义索引中,将深度学习抽象示意径直用于数据索引目的。而在数据记号中,抽象数据示意被视为推论数据记号的分手任务的特征,因此,这种对数据的记号也不错用于数据索引。将爽脆的线性建模步调应用于深度学习算法进行复杂特征的索要,不错已毕深度学习对多数数据的记号。本节的其余部分主要征询在数据记号的分手性任务中使用深度学习的一些效果。
在ImageNet计较机视觉竞赛中,Hinton等东说念主展示了一种使用深度学习和卷积神经汇集的步调 [20],该步调优于其他现存的图像对象识别步调。Hinton的团队诈骗ImageNet数据集展示了深度学习对矫正图像搜索的热切性,需要肃肃的是,ImageNet数据集是咫尺图像对象识别的最大数据集之一。Dean等东说念主通过使用类似的深度学习建模步调,以及用于考研东说念主工神经汇集的大范围软件基础设施,在ImageNet上取得了进一步的告捷 [15]。
文献 [21] [22] [23] 尝试使用受限玻尔兹曼机器(RBM)、自动编码器和疏淡编码等步调从未记号的图像数据中学习和索要特征。但是这些步调只可索要初级特征,举例边际和雀斑检测。深度学习还不错用于构建稀少高档的图像检测功能,举例,谷歌和斯坦福开垦了一个稀少大的深度神经汇集,它好像通过使用未记号的数据从零驱动学习稀少高档的特,如在莫得任何先验学问的情况下,进行东说念主脸检测或猫检测 [24]。他们的职责是对仅使用未记号(无监督)数据的深度学习构建高档特征的可行性进行大范围考核,并明晰地阐述了使用无监督数据的深度学习的平正。在谷歌的实验中,他们对从互联网上立时下载的1000万张200 × 200的图像考研了一个9层腹地贯通的疏淡自动编码器。该模子有10亿个贯通,考研时间执续3天。一个由1000台机器和16,000个内核组成的计较集群用于考研具有模子并行性和异步SGD (立时梯度着落)的汇集。在他们的实验中,他们取得了功能类似于东说念主脸检测器、猫检测器和东说念主体检测器的神经元,基于这些特征,他们的步调也优于最新工夫,并从ImageNet数据迷惑子别了22,000个对象类别。这阐述了通过深度学习算法索要的抽象示意在新数据或不能见数据上的泛化才略,即使用从给定数据集索要的特征在另一个数据集上告捷推论分手任务。固然谷歌的职责波及到一个问题,即只是使用未记号的数据是否有可能构建东说念主脸特征检测器,但无间在计较机视觉中,记号的图像用于学习有用的特征 [25]。举例,不错使用一大组东说念主脸图像,在东说念主脸周围有一个鸿沟框来学习东说念主脸检测器功能。可是,传统上,它需要多数的记号数据才能找到最好特征。图像数据采迷惑记号数据的稀缺性带来了一个具有挑战性的问题。
还有其他深度学习的效果探索了图像记号。Socher等东说念主先容了递归神经汇集,用于预测多模式图像的树结构,这是第一种深度学习步调在复杂图像场景的分割和谛视方面取得了稀少好的效果 [26]。递归神经汇蚁合构好像预测场景图像的档次树结构,优于基于要求立时场的其他步调或其他步调的组合,在分割、谛视和场景分类方面也优于其他现存步调。该商量还标明,他们的算法是预测树结构的天然用具,通过使用它来领会天然言语的语义。这阐述了深度学习行为从不同数据类型中索要数据示意的有用步调的上风。Kumar等东说念主建议,不错使用递归神经汇集通过深度学习构建特兴味兴味的搜索空间,然后将搜索空间用于基于联想的搜索 [27]。
Le等东说念主阐述,通过使用寂然变量分析从视频数据中学习不变性时空特征,深度学习不错用于动作场景识别和视频数据记号 [28]。当与深度学习工夫(如近似和卷积)结合学习分层示意时,他们的步调优于其他现存步调。昔日的作品用于将SIFT和HOG等图像的手工联想功能应用于视频领域。该项商量标明,径直从视频数据中索要特征是一个稀少热切的商量宗旨,也不错推论到很多领域。
深度学习在索要有用的特征(即示意)以对图像和视频数据推论分手任务,以及从其他类型的数据中索要示意方面取得了显耀的效果。这些具有深度学习的区别扫尾关于数据记号和信息检索稀少有用,而且不错在搜索引擎中使用。因此,通过深度学习取得的高档复杂数据示意关于大数据分析上钩算可行且相对爽脆的线性模子的应用稀少有用。可是,仍有多数职责有待进一步探索,包括详情学习致密表征的适合指标,以便在大数据分析中推论分手性任务。
5. 论断与预计
与更传统的机器学习和特征工程算法比拟,深度学习具有潜在的上风,不错提供一种处分决议来处分在多数输入数据中发现的数据分析和学习问题。更具体地说,它有助于从多数无监督数据中自动索要复杂的数据示意。这使得它成为大数据分析的一个有价值的用具,大数据分析波及到对多数原始数据的分析,这些原始数据无间是无监督和未分类的。深度学习中不同档次的复杂数据抽象的分层学习和索要为大数据分析任务提供了一定进度的简化,稀少是用于分析海量数据、语义索引、数据记号、信息检索及分手任务,如分类和预测。
在征询文献中的效果及关联配景后,商量重心温和与深度学习和大数据关联的两个热切领域:1) 用于大数据分析的深度学习算法和架构的应用,以及2) 大数据分析的某些特征和问题,如何为适合这些问题的深度学习算法带来私有的挑战。本文对深度学习商量和应用于不同领域的热切文献进行了有针对性的考核,以详情深度学习如何用于大数据分析的不同目的。
深度学习领域的低熟悉度值得深远商量。稀少是,咱们需要作念更多的职责,商量如何使深度学习算法适合与大数据关联的问题,包括高维度、流式数据分析、深度学习模子的可扩张性、矫正的数据抽象神色、溜达式计较、语义索引、数据记号、信息检索,用于索要致密数据示意的尺度,以及域自适合。改日的职责应侧重于处分大数据中常见的一个或多个问题,从而有助于深远学习和大数据分析商量。
基金技俩
大庆市指点性科技有贪图技俩(ZD-2020-12);黑龙江省天然科学基金技俩(LH2021F001)。
著述援用
贾好意思娟,李 欣,孔 靓,刘 春,邵国强. 深度学习在大数据分析中的应用商量Research of Deep Learning Applications in Big Data Analytics[J]. 软件工程与应用, 2022, 11(03): 549-557. https://doi.org/10.12677/SEA.2022.113057
参考文献极品熟女