- 相关推荐
学科前沿讲座心得
当我们受到启发,对生活有了新的感悟时,常常可以将它们写成一篇心得体会,这样我们就可以提高对思维的训练。那么心得体会怎么写才恰当呢?下面是小编收集整理的学科前沿讲座心得,供大家参考借鉴,希望可以帮助到有需要的朋友。
学科前沿讲座心得1
机器学习和数据挖掘这些年一直是计算机应用方面研究的重点和热点,首先要了解什么是数据挖掘,简单地说,数据挖掘是从大量数据中提取或"挖掘"知识。我一直对这方面的知识颇感兴趣,这学期学院开设的学术前沿讲座的课程,很有幸听到了文益民教授对于自己在机器学习和数据挖掘方面研究的讲座,让我对这些知识有了深入浅出的理解,受益匪浅。
12月5号,文益民教授做了题为“大规模数据的分类”的讲座,在讲座的最开始,文教授提到了戈登·德莱顿《学习的革命》一书,皆在指导我们如何积累知识如何思考如何学习如何去做研究,具有抛砖引玉的指导意义。在这之后,又对了解机器学习和数据挖掘首先要了解的知识做了简要的'说明,比如对于问题的分类是分为线性问题和非线性问题;比如聚类的含义是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程;比如对于这个世界上计算机的分类可以只分成工人(maker)和思考者(thinker)两类。至此正式进入问题的讨论。
对于这次讲座,文教授从四个方面进行了讲授。第一,实际应用中的大规模数据分类问题。第二,大规模数据给机器学习带来的挑战。第三,大规模数据分类算法的研究。第四,展望发展前景。文教授主要是在第三点中做了很多工作也取得了可喜的成绩。
在机器学习的实际应用中,大规模数据分类问题一般会应用在以下几个方面,在高速高精度的工业图像检测方面,在专利分类方面,在生物信息数据快速增长方面,在支持向量机参数选择方面。
大规模数据给机器学习带来的问题有:
1、算法一般不是收敛太慢就是难以收敛,训练时间过长。
2、海量数据无法一次装入内存。
3、算法可靠性得不到保证。
4、已经训练好的学习器遇到心得训练样本时需要重新训练。
在最重要的部分,文教授提到了几个重要的研究方法,包括算法,这里面包含有:
1、基于并行计算的算法。
2、以并行计算方法求解工作集方法中每个迭代步中二次规划的子问题。
3、meta-learning,最小最大模块化支持向量机以及快速模块化支持向量机。
4、cluster-svm,cluster-based-svm,cascade-svm。文教授在第三和第四点中都有自己的工作和贡献,在第三点中,他提出了分类面拼接算法,在第四点中,提出了分层并行支持向量机训练算法。对于分类面拼接算法我进行了比较仔细的了解,并下载阅读了文教授于20xx年3月份在湖南大学学报上发表的论文“基于分类面的快速模块化支持向量机研究”,对于分类面拼接算法有了初步的研究,下面说说我对这个算法的理解。
信息采集和信息处理技术的快速发展导致了诸如公共健康数据、信用交易数据、国家经济普查数据、网络文本数据和地理信息数据等大规模数据集的产生。由于训练时间很长和空间需求很大,现有的大多数机器学习算法很难被直接用于大规模数据的机器学习。
这个算法是针对大多数现有的机器学习算法处理大规模问题时需要的训练时间很长和存储空间很大的难点而提出的,英文名是psfnrsvms,
在训练阶段,psfm2svms采用一簇平行超平面对大规模问题实施软划分,然后针对每个子问题并行训练支持向量机。在测试阶段,测试样本坐落于哪个子问题所在空间中,就由该子问题训练的支持向量机给出判别结果。在4个大规模问题上的实验表明:与采取硬划分的快速模块化支持向量机(fm2svms)相比,软划分能够使psfm2svms得到更加光滑的分类面,因而ps2fm2svms的泛化能力较高。在不增加训练时间的条件下,psfm2svms减少了由于训练集分割导致的分类器泛化能力下降。
支持向量机方法的本质是在训练集的一个高维像空间中寻找最大间隔分类超平面,这个分类超平面对应于训练集所在空间的一个光滑曲面。如果采用训练集分割的方法,将这个光滑曲面分段求出,然后进行连接,就可以得到这个光滑曲面的近似曲面。
学科前沿讲座心得2
听了几位老师所讲的学科先沿讲座,我的感想颇多。尤其是对林林老师的《智慧时代中的挑战与机遇》颇有感触。下面我谈谈自己通过听讲,查资料,经过思考后对这一问题的理解。当今的信息新技术主要包括这么几类,即新息安全新技术:主要包括密码技术、入侵检测系统、信息隐藏技术、身份认证技术、数据库安全技术、网络容灾和灾难恢复、网络安全设计等。信息化新技术:信息化新技术主要涉及电子政务、电子商务、城市信息化、企业信息化、农业信息化、服务业信息化等。软件新技术:软件新技术主要关注嵌入式计算与嵌入式软件、基于构件的软件开发方法、中间件技术、数据中心的建设、可信网络计算平台、软件架构设计、soa与ria技术、软件产品线技术等。网络新技术:网络新技术包括宽带无线与移动通信、光通信与智能光网络、家庭网络与智能终端、宽带多媒体网络、ipv6与下一代网络、分布式系统等。计算机新技术:计算机新技术主要关注网格计算、人机接口、高性能计算和高性能服务器、智能计算、磁存储技术、光存储技术、中文信息处理与智能人机交互、数字媒体与内容管理、音视频编/解码技术等。
大胆的预测一下计算机技术往下怎么发展,因为形势明白了,历史规律搞清楚了,需求也明白了,该怎么做呢?我大胆做这么一个发言,中国计算机界必须把握机遇迎接挑战。看一下处理器方面该怎么做,上个世纪我们关心的是每秒种可以完成多少指令,处理的速度。后来发现不对,应该做高性能的处理器,每花掉一块钱可以处理多少能力,重要的是功耗要低,然后是无线,是互联,我们更关心消耗每瓦功率处理能力是多少,大家关心的点开始转移,从每秒处理能力,关心到每块买到多少处理能力,到最后消耗每瓦功耗有多少能力。在处理结构上面有什么变化,从上世纪70年代左右,人围着计算机转,每个单位只要很好就有一个漂亮的机房,大家围着机房转,算题是通过一个小窗口把题递进去,过一段时间里面算好,把题递出来。那时候一切围绕cpu转,所以那时候cpu当之无愧,我的处理器是中心所以叫cpu。再往下可以看到计算机围着人转,我们口袋里的手表等一切一切,人走到哪里,计算装备围着我来转,在机器内部不是围着cpu转,而是围着存储期,i/o,通道转,因此不能光搞cpu,比如出现pim等新的名称,所以我们应该与时俱进。从cpu,c要改成无处不在的处理单元。
网络将怎么发展,我们在上个世纪70年代所关心的就是互联互通互操作,在这儿不是讲互联互通互操作不重要,它是一个基础绝对重要,关心这个是数据和控制信号的传递,数据和控制信号可以传过去。做了一些日子以后发现,需求不仅仅是这个,我们要提高网络的带宽,我们关心是信息沟通和处理能力的增强,光把信号传过去是不是可以处理好呢?再往下又是怎样的?我们应该关心网上有这些信息,有这么多人用,是动态的变化,所以我们要关心信息融合、信息确认等。要把消息传给该给的人,该给的时间,该给的地方,该给的人,传正确的东西,这个变化不承认不行的,以往包括我个人在内,我和我同事们宣扬,看我家里环境,办公室环境,我计算机有多少能力联网,这已经过去了。下面关心的是这个网络具有多少计算个算计的能力,算计要做推理更难,再往下要面对什么问题?我的网络环境怎么样有非常强的.资源按需聚合,人机协同工作的协调能力,体系结构将怎么发展,70年代的时候,大家做体系结构设计,费劲脑筋是在计算机内挖掘可能的潜力,处理可能的矛盾,搞体系结构的人,什么是好的所长,厂长,它的学问是处理轻重缓急,这件事应该放得下,哪件事应该要处理,所以好的应该处理删、增、减、抑、扬,在这种情况下发现,我们设计在机群中挖掘和平衡,我们要在网络环境下怎么做挖掘和平衡,因为系统给人用的,机器的环境,是给销售人员,管理者用的,所以把协同工作做好,就要验证,所以从hpcs变成hpce,我们需要的不是高性能,需要的是生产力可用性,中国科学家预感比较早,因此1997年再一次会上,就决定当前做clieitserver,之后做cluster,之后做networking,之后是vse,基于网络的虚拟服务含量是未来体系结构的发展方向。这是1997年8月25号,到1998年的时候,世界有名的计算机科学家isea发表了grid专著,我们要把grid定位了,而是要考虑你究竟想干什么?我们做一个好的系统,必须要看到定位准确,你在这个坐标上关于服务,你是要做计算服务,还是数据服务,还是应用服务,还是信息服务,还是知识服务,还是实用的服务。如果明确了你的目标,你的技术就明确,你的评价指标就明确了。如果要做信息服务,你就要了解你处的信息是多大一块,这件事很重要,不能杀鸡用牛刀,也不能杀牛用鸡刀,如果系统力度大小这么大,最后生产的问题,究竟打算怎么交帐,是向投钱的单位交一个概念的设计,不是不可以的,还是交一个机理的设计,还是规则的设计,还是方法的设计,如果明确了,你的技术方案就明确了,你的机理就明确了,如果选定的方法层,你系统就要定位在这里,位置定对就满足正确的需求。
【学科前沿讲座心得】相关文章:
讲座课心得04-26
学术讲座心得02-14
讲座培训心得02-04
艾滋讲座心得11-20
管理讲座心得09-30
培训讲座心得09-28
法制讲座心得11-02
消防讲座心得01-24
名师讲座心得随笔12-09