信号差和飞行模式识别和人工智能

Human Computation&br&(我觉得最为形象的中文译名是“人肉计算”)&br&&br&2008年Amazon Mechanical Turk平台在计算机视觉领域首次亮相 [1],其后的几年,它的威力逐渐被人们所意识到。并在computer vision, machine learning领域扮演了越来越重要的角色。譬如NIPS 2010 best student paper runner up [2], ICCV 2013 best paper [3] (Marr prize) 都是人肉计算的范畴。&br&&br&上个月刚参加完2014年的 human computation 年会:&a href=&/2014/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&HCOMP 2014&i class=&icon-external&&&/i&&/a&,该会议更早以前是作为AAAI的一个分会,但是现在规模越来越大,已经独立出来了。&br&&br&&br&另外,对于楼主的具体问题(因为数据量小,所以更需要针对问题,人为设计合适的先验),人肉计算正合适。&br&&br&&br&====== 2:08AM更新,并同步转载到我的专栏======&br&根据 &a data-hash=&6a06d30e1d35db787be6a& href=&/people/6a06d30e1d35db787be6a& class=&member_mention& data-editable=&true& data-title=&@嗨谷歌& data-tip=&p$b$6a06d30e1d35db787be6a&&@嗨谷歌&/a& 同学的评论,更新一下。&br&&br&当下computer vision的数据集里,人肉计算思想用的最好的,当属林宗义同学主导设计的 &a href=&http://mscoco.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Microsoft COCO&i class=&icon-external&&&/i&&/a& [4]。其次则是Stanford李菲菲老师组的ImageNet [5]。之所以我认为MSCOCO比 ImageNet 强,是从人肉计算的角度来说的——估算下来,MSCOCO 每个比特标定数据的获取成本只有 ImageNet 的几十分之一!当然ImageNet是先行者,遇到的各种坑也比MSCOCO更多。在此我也无意衡量两个系统的历史地位孰高孰低。&br&&br&&br&而CV领域的其他数据集,哪怕是那些非常著名的数据集,也有不少蕴藏了大量的错误数据——包括在2013 [6] 和2014年 [7] 被我先后发文打脸的 Berkeley Segmentation Dataset [8] 和 EPFL FT dataset [9]。所以说人肉计算之于机器学习,可以说是承前启后。因为机器学习本身就是&b&数据推动&/b&的科学,而各种数据中,又数各种主观数据应用最广, 但最难建模。所以如何用人肉计算的手段,能够低成本地得到可靠的主观数据,就成了机器学习的根本问题。&br&&br&&br&我的一位师兄,[2] 的一作。在毕业后就开了一家公司叫Anchovi labs,专门做人肉计算平台。后来,他们公司成立8个月就被Dropbox收购了。(再后来做出来那个难用屎了的 Carousel 相册管理器是后话,按下不表)。&br&&br&&br&话又说回来,Deep learning为什么能火到现在这个程度?引爆点是那篇横空出世的alexnet [10]。这Alex跟之前没火起来的 neural networks(Boltzmann machine, auto-encoder, 甚至1989年的 LeNet)的区别是什么?&br&是对 海量 &b&带标定的 &/b&图片数据的胃口。&br&最早的LeNet自然不用想海量数据,但是到后来哪怕到了基于Boltzmann machine的第一代Google Brain,也没能如此充分地利用人肉标定数据(因为系统的很大一部分是unsupervised的,也就是说,不好直接引入人肉标定数据)。&br&&br&&br&最后,我的签名档,Artificial artificial intelligence,其实也在是向人肉计算致敬~&br&&br&&br&Reference&br&[1] Utility data annotation with Amazon Mechanical Turk - CVPR Workshop 2008&br&[2] The Multidimensional Wisdom of Crowds - NIPS 2010&br&[3] From Large Scale Image Categorization to Entry- Level Categories - ICCV 2013&br&[4] Microsoft COCO: Common Objects in Context - ECCV 2014&br&[5] ImageNet: A Large-Scale Hierarchical Image Database - CVPR 2009&br&[6] Boundary Detection Benchmarking: Beyond F-Measures - CVPR 2013&br&[7] The secrets of salient object segmentation - CVPR 2014&br&[8] A Database of Human Segmented Natural Images and its Application to Evaluating Segmentation Algorithms and Measuring Ecological Statistics - ICCV 2001&br&[9] Frequency-tuned Salient Region Detection - CVPR 2009&br&[10] ImageNet Classification with Deep Convolutional Neural Networks - NIPS 2012
Human Computation(我觉得最为形象的中文译名是“人肉计算”)2008年Amazon Mechanical Turk平台在计算机视觉领域首次亮相 [1],其后的几年,它的威力逐渐被人们所意识到。并在computer vision, machine learning领域扮演了越来越重要的角色。譬如NIPS 201…
&b&题主有时间&/b&、&b&在学校&/b&、&b&有C基础。&/b&&br&&br&建议:重点看C++ Primer 5th的 9-16章。1-8章快速通过,17-19看不看都行。用到的时候google+stackoverflow。我们在github上有个CP5的习题repo,欢迎report issue,欢迎贡献代码:&a href=&/Mooophy/Cpp-Primer& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Mooophy/Cpp-Primer · GitHub&i class=&icon-external&&&/i&&/a&&br&&br&另外,CP5有一些地方需要反思和小心:&br&1、过于迎合初学者,刻意回避了算法和数据结构,没能引导CP之后的学习方向。&br&没有算法和数据结构基础,理解STL是一句空话,即使把CP5背下来也没用。&br&&br&2、过分强调迭代,淡化递归,(可能是STL本身导致的)。&br&强化迭代,迭代器和容器分离并实现泛型是STL的优点,用起来就很爽。&br&但过于依赖迭代会被束缚思想。在归纳法、算法设计、复杂度分析、递推关系、编译等方面倍感不适。&br&&br&3、第十五章OO的习题和课文脱节,没提虚表。&br&C++盘子这么大,重中之重是STL,不提虚表也无可厚非。可不少面试官是C with class大师,虚表是常见考题,面试前别忘了专项补充。&br&&br&综上,题主如果有时间、有精力,建议如下路线:&br&CP5-&算导1-14章-&SICP-&龙书-&算导15-35章&br&&br&最后,补充一个个人看法:请把&b&工业级项目&/b&和&b&大学生个人发展&/b&区别对待。&br&从项目角度看,effective系列、google C++ style是非常有意义的,有效提升团队战斗力。&br&从个人发展角度说,&b&过早&/b&花精力在这些工程化、经验性的东西上会束缚思想、削足适履。而且也没用啊,在校生哪有太正经的项目可以做?这些东西连功利都谈不上,因为面试都不太考。。
题主有时间、在学校、有C基础。建议:重点看C++ Primer 5th的 9-16章。1-8章快速通过,17-19看不看都行。用到的时候google+stackoverflow。我们在github上有个CP5的习题repo,欢迎report issue,欢迎贡献代码:另外,CP5有一些…
来自子话题:
Siri 刚出来我就知道了(那时候正好在硅谷,天天玩 iPhone),并且为之着迷,不过这注定是一个在美国市场才会出现的产品。我当时就认为它代表了未来,果然,没过多久,它就被苹果 2.5 亿美金收购了。我当时写过一篇博客:&br&
&a href=&.cn/s/blog_5af583c20100gtbb.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&.cn/s/blog&/span&&span class=&invisible&&_5af583c20100gtbb.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&并且有一些评论:&br&&br&Siri 是一家服务型公司,而 Google只是一家数据公司。Google缺少服务的基因,这一点从最近的 Nexus One 手机发布后遇到的种种问题就可见一斑。Siri 这种模式可以称之为“信息服务”- IaaS(Information As A Service)。和 SaaS 不同,IaaS提供的是信息,而不是软件。和传统的搜索引擎相比,IaaS 提供的信息更加直接地符合用户的期望。我们使用传统搜索引擎,需要在返回的无数结果中寻找自己需要的信息,这不是用户期望的结果。为了更好地满足用户,各大搜索引擎都提出了整合搜索的概念,如果输入的是地址,结果就会直接显示地图,输入的是食物,结果就会直接显示菜谱。百度的“框计算”,也是类似的概念。但我认为,这种策略很可能是白白浪费了计算资源,最终结果的质量和 Yelp 这样的垂直数据服务根本没法比,更不要说和 Siri 这种服务比了。&br&&br&Siri 是一个 Mashup 的产物,其实就是“混搭”。国外的互联网在这方面比国内领先很多,各大小网站都开放自己的 API,才有可能搭出来这样的产品。用户要订餐,可以直接在第三方订座网站上完成订座,要出租车,可以直接整合叫车服务,要看演出,可以直接整合买票服务。如果这些服务都由一家公司搞定,简直是不可能的,而通过 API,都很方便的实现了。&br&&b&&br&&/b&&br&&b&
Siri = 服务混搭 + 结构化数据 + SNS 优化 + 一点人工智能 + 语音识别 = 未来的 IaaS&/b&&br&&br&未来的互联网,一定不是搜索引擎的天下,一定是 SNS 和 Siri 这样的 IaaS 的天下。&br&&br&至于说为什么国内出现不了 Siri,几方面的原因:没有足够丰富的 API,不鼓励创新(这个创新是比较费钱的),收购环境差。其它的欢迎朋友们补充。
Siri 刚出来我就知道了(那时候正好在硅谷,天天玩 iPhone),并且为之着迷,不过这注定是一个在美国市场才会出现的产品。我当时就认为它代表了未来,果然,没过多久,它就被苹果 2.5 亿美金收购了。我当时写过一篇博客: 并且有一些评…
来自子话题:
语音识别(Speech Recognition)是自然语言处理(Natural Language Processing)的一部分;而后者又是人工智能的一部分。所以上面的是个伪问题。 &br&&br&乔布斯在 D8 访谈中被问及苹果收购 Siri 的原因是否是想与谷歌竞争搜索业务时答曰:「他们(指 Siri)不是搞搜索的,他们是搞人工智能的。」—— 如果你一定要个答案的话。
语音识别(Speech Recognition)是自然语言处理(Natural Language Processing)的一部分;而后者又是人工智能的一部分。所以上面的是个伪问题。 乔布斯在 D8 访谈中被问及苹果收购 Siri 的原因是否是想与谷歌竞争搜索业务时答曰:「他们(指 Siri)不是搞…
来自子话题:
我:我想吃大便&br&siri:正在寻找公共厕所…&br&
找到以下公共厕所blablabla&br&&br&
我:我想吃大便siri:正在寻找公共厕所… 找到以下公共厕所blablabla ……
来自子话题:
&p&我也不知道相对Siri有哪些优势劣势,但是 短信交互功能真是太赞了!&/p&&br&&p&比如我&strong&躺在床上不想动,手机不知道在被窝里某处&/strong&。。。这时。。。&strong&来了条短信&/strong&!&/p&&p&小娜会说:你有一条短信,需要我读出来么?&/p&&p&&strong&我不知道手机在被窝哪个地方,我只要大声说:读!(要让小娜听见)&/strong&&/p&&p&小娜就会把那条短信读出来了!然后小娜会问你要回短信还是打电话还是跪安。&/p&&p&如果是条垃圾短信,&strong&我就直接说:没事了!&/strong&&/p&&p&如果想短信回某人,我就直接说:回短信,然后巴拉巴拉&/p&&p&&strong&你看,我都不知道我手机再哪里就可以完成这么多事情!真是太赞了&/strong&&/p&&br&&p&(话说回来,一般我就只用这个功能了,其他的功能还是很鸡肋。。。)&/p&
我也不知道相对Siri有哪些优势劣势,但是 短信交互功能真是太赞了!比如我躺在床上不想动,手机不知道在被窝里某处。。。这时。。。来了条短信!小娜会说:你有一条短信,需要我读出来么?我不知道手机在被窝哪个地方,我只要大声说:读!(要让小娜听见)…
除了深度学习,还有很多领域越来越受关注。 &br&1. MCMC, Variational Inference&br&如果看今年的ICML,就会发现关于MCMC论文就有10篇左右,大部分都是去解决大数据下的sampling问题。 关于variational method的论文也不少,一个原因就是跟深度学习有关系,因为在深度学习模型里,我们也会需要用这种算法得到近似解, 比如在RBM。 &br&2. 自然语言处理。机器学习(深度学习)在视觉领域上取得了很大的成果。相比之下,在自然语言处理问题上还是有很多难题要攻破。很多深度学习学者们预测下一个重要突破将是机器翻译。 看一下今年被ACL收录的论文(加上best paper),就会感觉到这个趋势。&br&3. Sparse, Robust Learning&br&几年NIPS的很多论文是关于这个方面。
&br&4. Submodularity (Discrete optimization)&br&这个领域也越来越火。tutorial: &a href=&http://submodularity.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&submodularity.org: Tutorials, References, Activities and Tools for Submodular Optimization&i class=&icon-external&&&/i&&/a&&br&5. Probablistic programming &br&这个算是近年来比较流行的话题。&br&6. Kernel methods, spectral methods. &br&Kernel是一直比较火的领域,spectral也感觉越来越火&br&7. Large scale optimization/inference, distributed learning &br&大数据时代嘛,没的说。 &br&8. Time series problem&br&这个算是在机器学习领域比较难的问题,深度学习在time series的问题上还需要很多的改进。处理time series的最大的问题是我们不能用bag of words的假设,而且每个样本的长度也不一样。 &br&9. Causal inference&br&这个问题目前虽然不算是热点,但值得去研究。目前,深度学习还没有办法去有效地解决这种问题。可以想象,在不久的将来,机器学习在医疗上的作用会越来越明显。
除了深度学习,还有很多领域越来越受关注。 1. MCMC, Variational Inference如果看今年的ICML,就会发现关于MCMC论文就有10篇左右,大部分都是去解决大数据下的sampling问题。 关于variational method的论文也不少,一个原因就是跟深度学习有关系,因为在深…
来自子话题:
純靠語音提供長答案確實不可行,理由同上方一切答主。但強烈呼籲知乎支持在文本答案中插入短錄音文件輔助答題,會對目前語言學/音韻學分區內的答題效率有顯著的幫助。
純靠語音提供長答案確實不可行,理由同上方一切答主。但強烈呼籲知乎支持在文本答案中插入短錄音文件輔助答題,會對目前語言學/音韻學分區內的答題效率有顯著的幫助。
机器学习、统计分析、数据挖掘、神经网络、人工智能、模式识别,很难说谁包含于谁,只能分开说每一个概念的意义,谁服务于谁。&br&&br&数据挖掘是一种概念,从数据中挖掘到有意义的信息。&br&很多人认为数据挖掘是新学科,是基于大数据,其实不然,如果给你一个数据说李嘉诚有100多亿美元,再给你一个数据是全国平均人均可支配收入水平是13279元人民币,你能挖掘出一个信息叫,李嘉诚很有钱,这也是数据挖掘。只不过很小白而已。&br&&br&模式识别是目的,识别出一种模式,比如两个眼睛一个鼻子的是人脸的模式。如果不通过电脑,手工的通过计算来识别模式,也属于模式识别&br&&br&机器学习是一种方法,通常用来进行模式识别,用机器去学习不直观的数据得到模式,这其中会需要用到各种各样的知识,比如统计分析的知识。&br&&br&人工智能,这个概念就大了,这个概念是想要人工制造出和人类一样的智能,所以很多人就想出了机器人这么一个科幻产物,有人类的智能,并且依托于机器的强大运算能力。事实上,人工智能也不一定要和电脑挂钩的,只不过现在只有电脑有这么强大的计算能力,如果有一天生物科技能够突破,说不定也能实现。(纯属YY)&br&&br&神经网络,这是学习算法中的一个很火的模型,它号称结合了多学科,模拟了人的神经过程,是很好的一种学习方法,可以说这个是基于统计学范畴的。&br&&br&有什么疑问再问我~
机器学习、统计分析、数据挖掘、神经网络、人工智能、模式识别,很难说谁包含于谁,只能分开说每一个概念的意义,谁服务于谁。数据挖掘是一种概念,从数据中挖掘到有意义的信息。很多人认为数据挖掘是新学科,是基于大数据,其实不然,如果给你一个数据说李…
来自子话题:
&p&已经更新了。简单用了几下。&/p&&p&1.中文识别率很高。之前用英文cortana简直太遭罪啊,10句5句听不懂。关于方言,自己会的试了几句,基本上北京以南的方言都识别不了。想想也正常,毕竟以普通话为数据做的,南方的方言都离普通话太远。不过之前在智机网上,微软官方cortana的测试招募,问题里面有提到方言的问题,应该是在做这一块。如果不是文字相通,很多方言简直就是另一种语言,可以理解。&/p&&p&2.技能。跟英文一样,可以挑逗可以唱歌;中文甚至可以对诗;也可以模仿明星的声音,比如林志玲、周杰伦、赵本山等(明星内容很少,绝大部分都没有,而且虽然本地化但是现在全球化这么厉害,哈利波特什么的其实也应该有的,不能只有中国的明星,太有局限性了);英文可以学猫叫、猪叫、狐狸叫,中文不行;或者还有更多技能没有发现。问她今年世界杯的冠军,她都不知道,学习好慢啊,我都想告诉她答案了。询问名人年龄的技能中文没有,英文版的有。&/p&&img src=&/becce0bf_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/becce0bf_r.jpg&&&br&&img src=&/6ba77b2a128bbc38e05d_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/6ba77b2a128bbc38e05d_r.jpg&&&img src=&/4a11f9c6a8ec8cccd9a12fd70ad8fa7b_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/4a11f9c6a8ec8cccd9a12fd70ad8fa7b_r.jpg&&&img src=&/3b03da721d10e41f360a_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/3b03da721d10e41f360a_r.jpg&&&img src=&/8e527fb657b37f05b571daf63637ca79_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/8e527fb657b37f05b571daf63637ca79_r.jpg&&&img src=&/377fa70ea9f6b80d3ba3f789f72be3d9_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/377fa70ea9f6b80d3ba3f789f72be3d9_r.jpg&&&img src=&/623dea45dbfcea264dfcc_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/623dea45dbfcea264dfcc_r.jpg&&&img src=&/9b14bbf1412ae5efef3c6e2a00acd350_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/9b14bbf1412ae5efef3c6e2a00acd350_r.jpg&&&br&&p&3.地点提醒、拨打电话提醒跟英文一样,都很实用,中文的地点库还是很全的,部分结果来自tripadvisor。可以直接告诉cortana下次去XX地方的时候提醒你做XXXX事,私人助手的关键部分。&/p&&p&4.中国特色服务。比如放假安排,非常实用。还有车号限行、PM2.5提醒什么的。另外必应词典每日单词,以及必应美图(希望英文cortana也能有)都很棒。&/p&&br&&img src=&/c0e384edfe0_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/c0e384edfe0_r.jpg&&&img src=&/62ab2f1b45c89db4a76d_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/62ab2f1b45c89db4a76d_r.jpg&&&br&&p&5.关于小娜这个难听名字,不用担心,用cortana一样识别。&/p&&p&6.没有强迫使用新logo,不错。可以自己切换玩。&/p&&p&7.兴趣功能很强大,可以添加各种东西。各种关键词都能加的话,如果能自定义个RSS也不错跟bing News链接一起。微软这么聪明,肯定不会这么干。&/p&&img src=&/700d681ed6a8cbf57c294cdd821a00d0_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/700d681ed6a8cbf57c294cdd821a00d0_r.jpg&&&img src=&/818a000d1dda66abd5673_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/818a000d1dda66abd5673_r.jpg&&&p&缺少的功能:&/p&&p&1.关键词屏蔽。真不想每天都看到那些来自腾讯的无用的XX新闻,又不是新闻联播。也不能屏蔽,差评。&/p&&p&2.希望添加城市特价机票提醒;或者航线特价机票提醒。有bing这些应该能做到吧。&/p&&p&3.目前数据还是比较依赖已有的合作方,比如美剧,如果爱奇艺没有,那么就不能订阅提醒。订阅的剧集,点击后是用IE打开的,并不是爱奇艺客户端。&/p&&img src=&/5a5854a9eadedd11f99b7e6fbcd3cb05_b.jpg& data-rawwidth=&768& data-rawheight=&1280& class=&origin_image zh-lightbox-thumb& width=&768& data-original=&/5a5854a9eadedd11f99b7e6fbcd3cb05_r.jpg&&&p&4.如果手机系统为英文,哪怕区域是中国也不能用cortana,微软限制太多。&/p&
已经更新了。简单用了几下。1.中文识别率很高。之前用英文cortana简直太遭罪啊,10句5句听不懂。关于方言,自己会的试了几句,基本上北京以南的方言都识别不了。想想也正常,毕竟以普通话为数据做的,南方的方言都离普通话太远。不过之前在智机网上,微软官…
首先关于语言的选择,个人认为还是Matlab比较合适,因为目前在学术领域,用Matlab的人感觉还是相对多一点的。题主如果在写代码的过程中遇到了问题,也比较方便向别人请教。目测开源的机器学习库也是Matlab更多。当然如果对程序速度有严格要求,就可以考虑C++。&br&&br&其次对于题主你来讲,最重要的问题是要明确自己的&b&目的&/b&。&br&说实话,如果只是一个课程作业的话,完全没必要深入到很多算法的细节,只要了解了算法的大体流程即可,再选择别人实现好的算法,多次测试,一般结果是可以让人满意的。&br&但如果题主是想继续在机器学习领域深入研究的话,了解算法细节就是必不可少的了。不过即便这样,还是要从简单入手逐渐加深难度。否则学习曲线太陡,一般人都hold不住。&br&(另外自己感觉机器学习还算是入门容易精通难的,深入研究充满了大量细节和数学,研究者们也在一直outperform其他人……( ̄ε ̄;))&br&&br&所以,综上,题主最好&b&从简单入手&/b&!( ̄ε ̄;)&br&先了解基本算法思路,再使用县城代码进行实验!&br&&br&在此,我强烈推荐一个模式识别库 &b&PRTools5&/b&!在这里下载:&a href=&/software/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Software - Pattern Recognition Tools&i class=&icon-external&&&/i&&/a&,作者叫&a href=&http://rduin.nl/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&R.P.W. Duin&i class=&icon-external&&&/i&&/a&。&br&这个库最大的优点就是简单方便,而且实现了大量大量常用算法,对于初学者,完全可以上手就用,避免陷入细节的泥潭。而且都经过大量测试,基本没有严重bug。简单举几个栗子:&br&首先,需要构造两个数据集:&br&&div class=&highlight&&&pre&&code class=&language-matlab&&&span class=&n&&A&/span& &span class=&p&&=&/span& &span class=&n&&prdataset&/span&&span class=&p&&(&/span&&span class=&n&&X1&/span&&span class=&p&&,&/span& &span class=&n&&Y1&/span&&span class=&p&&)&/span&
&span class=&n&&B&/span& &span class=&p&&=&/span& &span class=&n&&prdataset&/span&&span class=&p&&(&/span&&span class=&n&&X2&/span&&span class=&p&&,&/span& &span class=&n&&Y2&/span&&span class=&p&&)&/span&
&/code&&/pre&&/div&其中,prdataset是PRTools5中的函数,目的就是构造数据集……&br&X是训练数据矩阵,每一行是一个数据点(一个object),每列是一个特征(feature)。Y是一个列向量,代表数据X的标签。怎么样,简单吧……&br&之后,就可以进行分类(classification)了!&br&&div class=&highlight&&&pre&&code class=&language-matlab&&&span class=&n&&w1&/span& &span class=&p&&=&/span& &span class=&n&&knnc&/span&&span class=&p&&(&/span&&span class=&n&&A&/span&&span class=&p&&);&/span&
&span class=&n&&w2&/span& &span class=&p&&=&/span& &span class=&n&&qdc&/span&&span class=&p&&(&/span&&span class=&n&&A&/span&&span class=&p&&);&/span&
&span class=&n&&w3&/span& &span class=&p&&=&/span& &span class=&n&&svc&/span&&span class=&p&&(&/span&&span class=&n&&A&/span&&span class=&p&&);&/span&
&span class=&n&&w4&/span& &span class=&p&&=&/span& &span class=&n&&naivebc&/span&&span class=&p&&(&/span&&span class=&n&&A&/span&&span class=&p&&);&/span&
&span class=&c&&% ......&/span&
&/code&&/pre&&/div&其中,w1, w2, w3, w4 就是训练好的分类器了。knnc是knn…qdc是Quadratic Bayes Normal Classifier,svc是svc……naivebc是Naive Bayes。&br&至于各种参数呢?函数都已经自动选择了,当然题主根据自己要处理的具体问题,也完全可以手动指定。&br&之后就可以测试结果了,我们选择B作为测试集。&br&&div class=&highlight&&&pre&&code class=&language-matlab&&&span class=&n&&e1&/span& &span class=&p&&=&/span& &span class=&n&&testd&/span&&span class=&p&&(&/span&&span class=&n&&B&/span&&span class=&o&&*&/span&&span class=&n&&w1&/span&&span class=&p&&);&/span&
&span class=&n&&e2&/span& &span class=&p&&=&/span& &span class=&n&&testd&/span&&span class=&p&&(&/span&&span class=&n&&B&/span&&span class=&o&&*&/span&&span class=&n&&w2&/span&&span class=&p&&);&/span&
&span class=&n&&e3&/span& &span class=&p&&=&/span& &span class=&n&&testd&/span&&span class=&p&&(&/span&&span class=&n&&B&/span&&span class=&o&&*&/span&&span class=&n&&w3&/span&&span class=&p&&);&/span&
&span class=&n&&e4&/span& &span class=&p&&=&/span& &span class=&n&&testd&/span&&span class=&p&&(&/span&&span class=&n&&B&/span&&span class=&o&&*&/span&&span class=&n&&w4&/span&&span class=&p&&);&/span&
&span class=&c&&% ......&/span&
&/code&&/pre&&/div&这里的e就是classification error……当然也可以选择其他函数,使用其他判断标准。&br&&br&但鉴于题主的数据是二维的,因此可视化是一个很好很强大的手段。(二维的!这年头哪还有这么好的事└(T_T;)┘……)。以下举例:&br&&div class=&highlight&&&pre&&code class=&language-matlab&&&span class=&n&&A&/span& &span class=&p&&=&/span& &span class=&n&&gendatb&/span&&span class=&p&&([&/span&50 50&span class=&p&&]);&/span&
&span class=&n&&B&/span& &span class=&p&&=&/span& &span class=&n&&gendatb&/span&&span class=&p&&([&/span&400 400&span class=&p&&]);&/span&
&/code&&/pre&&/div&此处使用了PRTools5自带的数据生成函数,A、B都是二维数据,2 classes,每类中有50(400)个objects。&br&&div class=&highlight&&&pre&&code class=&language-matlab&&&span class=&n&&w1&/span& &span class=&p&&=&/span& &span class=&n&&knnc&/span&&span class=&p&&(&/span&&span class=&n&&A&/span&&span class=&p&&);&/span&
&span class=&n&&w2&/span& &span class=&p&&=&/span& &span class=&n&&qdc&/span&&span class=&p&&(&/span&&span class=&n&&A&/span&&span class=&p&&);&/span&
&span class=&n&&w3&/span& &span class=&p&&=&/span& &span class=&n&&svc&/span&&span class=&p&&(&/span&&span class=&n&&A&/span&&span class=&p&&);&/span&
&span class=&n&&w4&/span& &span class=&p&&=&/span& &span class=&n&&naivebc&/span&&span class=&p&&(&/span&&span class=&n&&A&/span&&span class=&p&&);&/span&
&span class=&c&&% ......&/span&
&/code&&/pre&&/div&……不用解释。&br&&div class=&highlight&&&pre&&code class=&language-matlab&&&span class=&n&&scatterd&/span&&span class=&p&&(&/span&&span class=&n&&B&/span&&span class=&p&&);&/span& &span class=&c&&% 做测试数据散点图&/span&
&span class=&n&&hold&/span& &span class=&n&&on&/span&
&span class=&n&&h1&/span& &span class=&p&&=&/span& &span class=&n&&plotc&/span&&span class=&p&&(&/span&&span class=&n&&w1&/span&&span class=&p&&);&/span& &span class=&c&&% 做出分类器边界图,以下类似&/span&
&span class=&n&&h2&/span& &span class=&p&&=&/span& &span class=&n&&plotc&/span&&span class=&p&&(&/span&&span class=&n&&w2&/span&&span class=&p&&,&/span& &span class=&s&&'b'&/span&&span class=&p&&);&/span&
&span class=&n&&h3&/span& &span class=&p&&=&/span& &span class=&n&&plotc&/span&&span class=&p&&(&/span&&span class=&n&&w3&/span&&span class=&p&&,&/span& &span class=&s&&'g'&/span&&span class=&p&&);&/span&
&span class=&n&&h4&/span& &span class=&p&&=&/span& &span class=&n&&plotc&/span&&span class=&p&&(&/span&&span class=&n&&w4&/span&&span class=&p&&,&/span& &span class=&s&&'y'&/span&&span class=&p&&);&/span&
&span class=&n&&legend&/span&&span class=&p&&([&/span&&span class=&n&&h1&/span&&span class=&p&&,&/span& &span class=&n&&h2&/span&&span class=&p&&,&/span& &span class=&n&&h3&/span&&span class=&p&&,&/span& &span class=&n&&h4&/span&&span class=&p&&],&/span& &span class=&s&&'knnc'&/span&&span class=&p&&,&/span& &span class=&s&&'qdc'&/span&&span class=&p&&,&/span& &span class=&s&&'svc'&/span&&span class=&p&&,&/span& &span class=&s&&'naivebc'&/span&&span class=&p&&)&/span&
&/code&&/pre&&/div&结果如下:&br&&img src=&/2387ae36edb807f95c346dc12b0d8b3c_b.jpg& data-rawwidth=&905& data-rawheight=&758& class=&origin_image zh-lightbox-thumb& width=&905& data-original=&/2387ae36edb807f95c346dc12b0d8b3c_r.jpg&&这时真相大白,原来gendatb是生成banana形状的数据…………而且显然,对于这种数据,knn的效果最好。&br&&br&总之PRTools5是一个非常强大的模式识别库。&br&&br&而且这时再看,机器学习也就不麻烦且不抽象了吧~~
首先关于语言的选择,个人认为还是Matlab比较合适,因为目前在学术领域,用Matlab的人感觉还是相对多一点的。题主如果在写代码的过程中遇到了问题,也比较方便向别人请教。目测开源的机器学习库也是Matlab更多。当然如果对程序速度有严格要求,就可以考虑C+…
谢邀,我的研究正好是做DSP和Learning方面的。我觉得题主的困惑可能很多人在本科阶段都有过(学霸除外,有什么东西能让学霸困扰?),所以不必焦虑。我以前回答过一个问题:&a href=&/question/& class=&internal&&数字图像处理专业如何快速入门?谢谢。&/a&如果你是自学发现很多数学理论看不懂,可以参考这个帖子我的回答。&br&针对你的问题,我的回答如下&br&&b&理解与应用 v.s 严格的数学推导&/b&&br&坦诚的说,如果题主所指的DSP是传统的领域(Nyquist体系的信号处理),这个领域已经被研究得非常成熟了。相应的,各种数学分析和理解也被推导和研究了一百遍啊一百遍!所以看不懂那些数学推导很正常。虽然作为一个PhD学生这么说可能不太负责,但是对于本科生来说,很多数学推导看不懂就看不懂吧。我觉得如果你不是个完美主义者的话,没必要非要在数学上把他理解个透彻。因为这里面的数学太深了...很可能你想通了一个体系,又会产生出来更多的问题,学海无涯啊...所以我的建议是,对于本科生而言,理解和应用更重要。当然科研另说,发论文你不写满公式都不好意思跟人打招呼有木有!&br&&br&&b&完全不管这些奇怪的东西是怎么得到的,真的可以吗?&/b&&br&题主你说到作业里会有很多数学推导的题目。真讨厌啊,我当时也是这么想的,这些证明啊兴致啊什么的,干嘛不去死呢。但想一想,完全不管他们,那么DSP就没有意义了。本来DSP就是一门很数学的科目,一般都是理论上有突破了才能带动应用发展。换句话说,你不能完全跳过推导,把这些东西当Black Box处理。所以题目考这些,是有道理的。换个角度讲,你只需要理解这些考的题目里面的东西差不多就够了,因为我猜老师们应该也不会太过分的。&br&&br&&b&适度地理解和有限制地探索原理&/b&&br&我觉得本科生的时间是很紧张很宝贵的。如果怀着一颗心想读PhD的心的话,不要花在这些永无止尽的数学推导上。但你需要Intuitively理解这些信号处理的原理。比如一些基本的性质,问你为什么的话,你可以给出一句话的简单但是正确的解释吗?做到这点,一下是我的一些个人经验:&br&1) 重要性:定义&性质&证明推导&br&与其去摸索那些繁琐的证明,另外两个东西可能更重要一些。定义一定要清楚!我曾经做过一段时间助教,很多学生来问的问题,经常是因为没有搞清楚定义。书上的定义可能一句话带过,但其实万变不离其宗,弄清楚他到底想强调什么重要。除了定义以外是性质,考试可能大部分时候会考性质。记性质不能靠死背,你需要抽象地理解,为什么会有这个性质。性质所涉及的一些数学推导可能需要过一遍,这些才是最重要的。&br&2)自己总结归纳,不要抄书上的&br&我觉得真正的理解,绝不是搬出书上的证明来给我看,你需要自己能很精辟和简洁地一句话讲出来。这需要你在理解之后进行总结归纳,理解又归纳之后这知识就是你的了!随时随地抛开书,你都能给一帮新生来一段2小时的workshop侃侃而谈,这才是流弊的理解境界。&br&3)工程和数学最大的区别,就是不要忘记实际应用的意义和价值&br&我的很多朋友做DSP做到最后,发现自己都分不清到底是做Engineering还是Math了。但是作为一个合格的攻城狮,我们应该时刻不忘这些知识的实际意义。相信我,推公式你是推不过数学系的那帮家伙的。不过既然DSP是作为EE里的一个领域,说明他是一门很实际的学问。在推导公式之前,想想他的1)实际意义是什么?2)有没有形象的空间表达?3)为什么要这么变化,意义在哪?&br&&b&拿最常见的Fourier Transform举例:&/b&&br&第一个问题,他的实际意义就是拿到了频域的信息。他是得到的频谱上的强度啊!不光是一个什么乘以&img src=&/equation?tex=e%5E%7B-j%5Cpi+%5Comega%7D+& alt=&e^{-j\pi \omega} & eeimg=&1&&然后积分啊有木有!他是有意义的!知道这个意义之后,这个公式就好记多了,甚至你还可以由此联想,如果把Fourier Series和Fourier Transform联系起来。&br&第二个问题,形象的空间表达(geometric illustration)对帮助理解很重要。所谓Fourier Transform,说白了就是把现在这个由spacial unit vector作为basis的domain转换到Fourier Domain里去。打个比方,要表达在3维空间里的一个向量,你既可以用(x,y,z)表达,也可以用(&img src=&/equation?tex=%5Ctheta%2C+%5Cgamma%2C+r& alt=&\theta, \gamma, r& eeimg=&1&&)来表达。而Fourier Transform(还有逆变换)这里就是告诉你如何在这两个系统之间转换。&br&第三个问题,为什么大家都想做Fourier Transform,不可以是其他的变化吗?肯定是有意义的。其中一个意义,第一个问题已经回答了,因为我们想知道他的频谱,这样我们就直观的知道他在什么频率上强和弱,便于分析。另外,Fourier Transform也是很好的稀疏表达的方式,因为往往很多的信息都是集中在低频里的,这样我们往往只需要记录他的低频信息,忽略掉高频,就可以在不牺牲很大品质的前提下,保存信息(比如mp3)。也可以用来降噪,你只需要Zero掉高频率信息就好,因为噪声往往没有规律,比如白噪声平均分布在频谱,而信号却不是。&br&&br&以上就是一些小小的tips,希望对题主有用
谢邀,我的研究正好是做DSP和Learning方面的。我觉得题主的困惑可能很多人在本科阶段都有过(学霸除外,有什么东西能让学霸困扰?),所以不必焦虑。我以前回答过一个问题:如果你是自学发现很多数学理论看不懂,可以…
来自子话题:
这个真的是个很老的技术,如果只是V to T的话,我记得我在用Delphi5的时候就用过一个IBM做的叫VoiceType的开发套件,当时就已经很成熟了,从七八十年代开始基本没有脱离过HMM模型。在90年代初的时候AT&T就做过类似的东西做自动呼叫(VRCP),大概就是在一定功能下替代人工服务的业务。&br&这里真正难的地方是语义识别的部分,很不巧,这部分无论是技术门槛高还是前期投资都是高的吓人,需要海量的数据和数据处理能力在背后驱动。在现在苹果、微软、Google、AT&T和IBM一大堆的公司都在做的时候,没道理创业公司能够从里面抢到市场。&br&另外其实现在对这个功能的是没有主动需求的,大多是对现有某些功能的完善,例如对输入需求的扩展,对搜索需求的扩展。无论以后会在手机会在汽车还是会在家里加上这些智能的语音识别功能,更多的是主要产品的提供商自己供应的,像iOS和Android已经有了,因为这些公司只是靠这个功能改善用户体验,对自己现有的基本功能做补充,对于手机公司来说,只是把他们的基础操作方式除了触控之外,增加了一种语音控制。另外像Siri出来之后很多人都是短期对其好奇产生的热度,平时真正很少去用。综上对现在的互联网也不会产生太大的影响,只是多了一种输入方式。&br&在现有大公司已经做了这么多年,且投入产出不成正比的情况下,这个产业和创业公司应该是没什么关系,谈不上有竞争,更不会被创业公司颠覆。但有可能会产生一定的机会,主要集中在:&ol&&li&可能某些公司会开放他们的语料库,创业公司可能能够在冷门领域抢到市场,例如跟教育或者医疗有关的,别的公司还没有触及的地方。(NTT应该是做过在金融方便的很多应用,不过不了解具体的方向。)&br&&/li&&li&可能某些公司会开放api,某些创业公司可以做一些结合的东西,例如在Siri里做一个语音编程的东西之类的。(现在已经有人在越狱的4S上做这些了。)&/li&&/ol&PS1:据说Android的语音搜索功能是建立在几年前Google曾经做过打电话搜索的业务,然后记录下来了每个人的录音,后来这个业务被停掉了,但是收集了大量的语音信息。&br&PS2:我见过国内一个很扯淡做Siri中文版的做法,就是把中文语音转化成英文后用Siri翻译,然后再翻译回来。
这个真的是个很老的技术,如果只是V to T的话,我记得我在用Delphi5的时候就用过一个IBM做的叫VoiceType的开发套件,当时就已经很成熟了,从七八十年代开始基本没有脱离过HMM模型。在90年代初的时候AT&T就做过类似的东西做自动呼叫(VRCP),大概就是在一定…
来自子话题:
“小猿搜题”主要用到计算机视觉、OCR识别、搜索引擎和NLP等相关知识。&br&&br&具体技术方面,计算机视觉方面需要用到版面分析、纠偏、去噪、文字定位、切分、增强现实等技术;OCR识别除了采用传统的OCR技术之外,更多的用到目前如日中天的Deep Learning识别技术,通过采用性能卓越的GPU系统,能够使得训练能够支撑千万量级的训练数据,同时线上预测也能快速完成。总体来说,计算机视觉和Deep Learning还是比较有门槛的,需要慢慢积累。识别过程中因为模糊或者其他一些因素导致某些字符无法识别,采用语言模型进行修正是个很不错的方法。搜索引擎方面则是将识别出来的字符作为query从题库中找出想要的题目,主要包括倒排索引和排序,这方面最大的坑在排序,采用Learning to Rank等技术也是非常自然之选。
“小猿搜题”主要用到计算机视觉、OCR识别、搜索引擎和NLP等相关知识。具体技术方面,计算机视觉方面需要用到版面分析、纠偏、去噪、文字定位、切分、增强现实等技术;OCR识别除了采用传统的OCR技术之外,更多的用到目前如日中天的Deep Learning识别技术,…
来自子话题:
***无需ROOT 无需拔卡***&br&1.手机语言设为英语或繁中,开飞行模式,关闭位置服务&br&2.进入设置-apps,清除google play services、 google search和google services framework(最好再清除一下play商店)的数据&br&3.飞行模式下,连接wifi,长按主界面,进入设置-account&privacy,退出当前账号&br&4.重启手机,依然是飞行模式 连接wifi,翻墙&br&5.打开google(蓝色的APP),重新登陆账号,然后就会出来google now的开启向导,点下一步就行了.&br&6.千!万!不!要!设!回!简!体!中!文!千!万!不!要!设!置!成!简!体!中!文!&br&&br&============&br&注:google搜索这个app更新到4.1之后可以切换为简体但是他判断依据变成了运营商,也就是说noroot方式失效了。&br&============&br&再注: Google now现在已经支持简体中文&br&&img src=&/0edce9e56ce75fe89be3ff07_b.jpg& data-rawwidth=&1080& data-rawheight=&1920& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/0edce9e56ce75fe89be3ff07_r.jpg&&
***无需ROOT 无需拔卡***1.手机语言设为英语或繁中,开飞行模式,关闭位置服务2.进入设置-apps,清除google play services、 google search和google services framework(最好再清除一下play商店)的数据3.飞行模式下,连接wifi,长按主界面,进入设置-acco…
来自子话题:
第一个答案很不错.我就补充几点,其实要理解上面全部笑点,主要要知道他们的一些俚语和典型的幽默句式. 下面的解释不是来自我一个人的,而是得到了旁边几个老美同事的帮助.&br&&br& today I was asked to warm up the crowd which should be easy since the high will be 75 degrees.&br&--- 这个比较简单, Warm up是开场的意思.比如足球赛开始之前,球员在场上热身叫warm up. 但是Siri这里使用其原意&暖和温度&,还特地调出Temperature app,查出今天温度75F. 因为今天温度还算比较高.所以它说warm up起来不是特别难.&br&&br& San Fran – the ATM of Silicon Valley ... I found 396 Venture Capital firms fairly close to you.&br&--- 调侃SF的风投特别多,同时还专门调出搜索程序搜附近的VC firms.&br&&br&how many developers does it take to change a light bulb&br&--- How many XXXs does it take to change a light bulb?
这是美国典型的幽默句式. 这话并不是要问换灯泡到底需要多少人力,而是引出每一个行业或者领域的人,他们所拥有的独到的说话和做事风格. 看这个: &a href=&http://en.wikipedia.org/wiki/Lightbulb_joke& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&en.wikipedia.org/wiki/L&/span&&span class=&invisible&&ightbulb_joke&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&I see lots of familiar interfaces in the crowd. Looks like Instagram finally accepted Facebook’s friend request.&br&--- Interface 有程序里面的编程借口的意思,属于非常geeky的话. 后面Instagram accept Facebook's friend request这个不言而喻.&br&&br&Hey, any of you guys been working with Ice Cream Sandwich or Jelly Bean? Who’s making up these code names? Ben & Jerry’s?.&br&--- Google Android的codename全部选取食物名,从A开头,一直延续下去. 具体参考这个链接里面的第一个表: &a href=&/source/build-numbers.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/sour&/span&&span class=&invisible&&ce/build-numbers.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&
用的最多的2.3是Gingerbread, 市面上最新的是 ice cream sandwich (4.0),下一代叫 jelly bean. 另外在Google Mountain View总部的Android大楼外面就放有之前版本名所代表的点心的巨像: &img src=&/ac3c3c721d_b.jpg& class=&content_image&&(上图: Cupcake, Froyo, Ice cream sandwich, Honeycomb, Android机器人, Donut)&br&最后Ben & Jerry是美国一个冰激凌的chain store. Apple这里故意在嘲笑Android的命名怪异和花里胡哨.&br&&br&And speaking of dinner, after the show, if you’re looking to paint the town red, I found a number of Sushi restaurants whose reviews mention $2 Sake bombs fairly close to you. The guys at Yelp know what I’m talking about.&br&--- &a href=&/question/& class=&internal&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/question/2029&/span&&span class=&invisible&&9099&/span&&span class=&ellipsis&&&/span&&/a&&br&&br&Now I want to say something straight from the CPU; iPad, can you slow it down a bit? &br&--- 这个通过老美的典型句式,由 say something straight from my heart改编而来.显示Siri其geek的一面;&br&&br&完~
第一个答案很不错.我就补充几点,其实要理解上面全部笑点,主要要知道他们的一些俚语和典型的幽默句式. 下面的解释不是来自我一个人的,而是得到了旁边几个老美同事的帮助. today I was asked to warm up the crowd which should be easy since the high will …
来自子话题:
&p&用过siri,google now以及Cortana英文版,正在用小娜。作为一个光晕系列脑残粉,个人认为Cortana(小娜)完虐google now,略胜siri。&/p&&p&原因如下,&/p&&p&1、很简单,打开google now是个技术活,为此我还挂了vpn,其次google now除了能在一些比如说打开网页、提醒及闹钟、百科方面主动回答外,其余只是搜索,比起siri和Cortana的调戏功能差了很多,感觉“它”只是一个听命令的机器,毫无生命的感觉。&/p&&p&2、说到siri,如果苹果这几年投入下去的话,“她”估计会相当牛逼,毕竟群众基础在那呢,但是依我看,siri比起发布时几乎木有太大长进,配音以我的标准还听的下去,功能中规中矩。Siri没有一个形象这点比起Cortana扣分太多&/p&&p&3、最后,大头来了,Cortana具有siri和google now所不具备的&与用户联动&(自创名词)功能,最明显的感觉就是&b&“她”有一个形象&/b&!特别是对于光晕脑残粉的我。我心中对“航向黎明号”的断裂船体发出的“this is UNSC FFG-201 Forward Unto Dawn.......”之后小娜唤醒了士官长有着强烈的记忆呢!还有比起国际版的圈圈,小面团动起来的时候真的萌爆了!!(看截图我还觉得丑来着)。再有比如你说&明天中午提醒我吃饭&,小娜会问&好的,那是什么时候提醒你呢?&,你可以回答12:00,然后小娜用&b&笑着的口吻&/b&回答&好的,没问题了,我会提醒你的!&,顿时备感贴心。感觉以微软的更新频率和这种态度,完爆其他两家只需一年&/p&&p&以下是我使(tiao)用(xi)小娜的截图&/p&&p&这是我第一次启动Cortana,当时是4月份还是英文版&img src=&/b57375ef3bdfb4e9eb964b4_b.jpg& data-rawheight=&800& data-rawwidth=&480& class=&origin_image zh-lightbox-thumb& width=&480& data-original=&/b57375ef3bdfb4e9eb964b4_r.jpg&&&/p&&p&问她Cortana是什么意思,让我这种光晕脑残粉米有失望&img src=&/49671bef14efe9b459f5c_b.jpg& data-rawheight=&800& data-rawwidth=&480& class=&origin_image zh-lightbox-thumb& width=&480& data-original=&/49671bef14efe9b459f5c_r.jpg&&&/p&&p&接下来换用Lumia1520,截图变大,同时也上了中文小娜&img src=&/63f29fa437f0e9ed138ce167770aaa38_b.jpg& data-rawheight=&1920& data-rawwidth=&1080& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/63f29fa437f0e9ed138ce167770aaa38_r.jpg&&&/p&&p&还是那个Cortana,让我放心了&img src=&/d7be52bef31d33a74a12_b.jpg& data-rawheight=&1920& data-rawwidth=&1080& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/d7be52bef31d33a74a12_r.jpg&&&/p&&p&叫她国内版的翻译“科塔娜”也可以&/p&&img src=&/94f49b8a724b3588ac7b_b.jpg& data-rawheight=&1920& data-rawwidth=&1080& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/94f49b8a724b3588ac7b_r.jpg&&&p&阅读越来越快,之后浓浓的机械合成音发音。。不过还是很可爱的&br&&/p&&img src=&/14042a97bbb1229f2debe7_b.jpg& data-rawheight=&1920& data-rawwidth=&1080& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&/14042a97bbb1229f2debe7_r.jpg&&
用过siri,google now以及Cortana英文版,正在用小娜。作为一个光晕系列脑残粉,个人认为Cortana(小娜)完虐google now,略胜siri。原因如下,1、很简单,打开google now是个技术活,为此我还挂了vpn,其次google now除了能在一些比如说打开网页、提醒及闹…
目前有三类处理方法:&br&&br&1. 用平均值、中值、分位数、众数、随机值等替代。效果一般,因为等于人为增加了噪声。&br&&br&2. 用其他变量做预测模型来算出缺失变量。效果比方法1略好。有一个根本缺陷,如果其他变量和缺失变量无关,则预测的结果无意义。如果预测结果相当准确,则又说明这个变量是没必要加入建模的。一般情况下,介于两者之间。&br&&br&3. 最精确的做法,把变量映射到高维空间。比如性别,有男、女、缺失三种情况,则映射成3个变量:是否男、是否女、是否缺失。连续型变量也可以这样处理。比如Google、百度的CTR预估模型,预处理时会把所有变量都这样处理,达到几亿维。这样做的好处是完整保留了原始数据的全部信息、不用考虑缺失值、不用考虑线性不可分之类的问题。缺点是计算量大大提升。&br&而且只有在样本量非常大的时候效果才好,否则会因为过于稀疏,效果很差。
目前有三类处理方法:1. 用平均值、中值、分位数、众数、随机值等替代。效果一般,因为等于人为增加了噪声。2. 用其他变量做预测模型来算出缺失变量。效果比方法1略好。有一个根本缺陷,如果其他变量和缺失变量无关,则预测的结果无意义。如果预测结果相当…
简答一下这个问题,这是统计和机器学习中经典的p && n的问题。可以去翻翻做biostats的paper&br&解决这个问题的基本思路就是加上各种约束条件,使得问题变得可解。最常见的选择就是sparse regularization。其作用就是让系数矩阵稀疏,从而完成特征选择(非零项就是选择的feature)。这样比较有意思的是,把传统machine learning中的特征选择和训练分类器的过程统一在了一个一步的框架下。常见的sparse regularization就是l1了,其变种有无数多,比如各种non-convex的:SCAD, MCP,各种group sparse:l2,1等等。&br&至于这个sparse问题的解法,这个话题就更加复杂。。。这里就不展开了。&br&再至于说做audio classification能不能work,我个人感觉这样直接做不会太好的。
简答一下这个问题,这是统计和机器学习中经典的p && n的问题。可以去翻翻做biostats的paper解决这个问题的基本思路就是加上各种约束条件,使得问题变得可解。最常见的选择就是sparse regularization。其作用就是让系数矩阵稀疏,从而完成特征选择(非零项就…
来自子话题:
不知具体情况,可以试一试以下几种方法。如果哪个都不work,就不用请饭了!:-)
&br&&br&1.在pc中打开PDF -—&打印,选择 Microsoft Office Document Image Writer —&保存文件.mdi格式,打开文件-& 工具-&使用ORC识别文本即可 。
&br&&br&2.(适合大量文本,少量的不如自己打字了)将图片中的文字转换为TXT文本。首先保证你的机器上装有PhotoShop,再从网上下一个清华紫光的OCR识别软件安装好。打开PS,从文件-导入-PDF图像找到你需要的处理的文件全部导入后,将需要处理的页面 保存为BMP或者TIF文件后。打开OCR识别软件,将图片调入后进行识别,识别出来后保存就可以了,程序自动将其保存为TXT文件。有一点需要说明:两个软件处理的时候会将每一个页面保存为每一个文件。如果文档为英文且字体比较小的话识别时会有些错误。比如会将i识别为l之类,在识别后你可以对照修改再保存。
&br&&br&3.现在有很多“PDF”转换为“TXT”的软件,不是对中文支持不好,就是共享软件,需要注册才可以使用全部功能。其实并不需要第三方软件,用百度的硬盘搜索,也可以免费将PDF转换为文本文件。
&br&&b&第一步:&/b&首先进入百度硬盘搜索的主界面,在文档下选择PDF(免费下载硬盘搜索程序:&u&&a href=&/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&&/u&) 
&br&&b&第二步:&/b&接下来输入文件所在的目录,点击“在结果中查找”按钮,会在下面显示出所要寻找的PDF文件
&br&&b&第三步:&/b&在要进行转换的PDF文件右边点击“快照”按钮,就会以纯文本的形式将文件内容显示出来。需要做的就是将文件内容复制,并且粘贴到记事本中保存,这样就可以将PDF的内容转换成TXT纯文本了。
&br&&br&4. Office2003实现PDF文件转Word文档:有人经过尝试,发现可以利用 Office 2003 中的 Microsoft Office Document Imaging 组件来实现PDF转Word文档,也就是说利用Word来完成该任务。方法如下: 用Adobe Reader 打开想转换的PDF文件 ,接下来 选择 “文件→打印”菜单,在打开的“打印”窗口中将 “打印机”栏中的名称设置为 “Microsoft Office Document Image Writer”,确认后将该PDF文 件输出为 MDI格式的虚拟打印文件。
&br&&br&5.下载PDF2TXT软件转换器程序PDF2TXT v3.1 汉化版,下载地址:&a href=&http://www.newasp.net/soft/dl008198.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&newasp.net/soft/dl00819&/span&&span class=&invisible&&8.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&。
不知具体情况,可以试一试以下几种方法。如果哪个都不work,就不用请饭了!:-) 1.在pc中打开PDF -—&打印,选择 Microsoft Office Document Image Writer —&保存文件.mdi格式,打开文件-& 工具-&使用ORC识别文本即可 。 2.(适合大量文本,少量的不如自己…

我要回帖

更多关于 图像处理和模式识别 的文章

 

随机推荐