·

Supervised and Unsupervised learning in machine learning

发布时间:2024-07-13 12:16:22阅读量:505
转载请注明来源

Machine learning is a subject of artificial intelligence, which means programming computers in terms of algorithm so that they can learn from data. Supervised learning and unsupervised learning are two types of Machine Learning systems. One can easily tell the difference between them by the criterion: whether or not they are trained with human supervision.

Supervised learning and unsupervised learning are two extreme. The former completely depends on human supervision, while the latter doesn't need human supervision at all.  

Supervised learning

In supervised learning, you use the completely labeled training set to feed the algorithm. In other words, you label your desired solutions in the training set before feeding it to the machine.

There are two typical types of supervised learning:

  • Classification. For example, the spam filter is trained with many example emails which are labeled as spam or ham. It must learn from this labeled training set to classify new emails.
  • Regression. The task of regression is to predict a specific numeric value, such as the price of a book, given a set of features (publisher, age, cover, etc.) called predictors. To train the system, you need to feed it with many examples of books, including both their predictors and their prices.

The following are some of the most important supervised learning algorithms:

  • k-Nearest Neighbors
  • Linear Regression
  • Logistic Regression
  • Support Vector Machines (SVMs)
  • Decision Trees and Random Forests
  • Neural networks

Unsupervised learning

In unsupervised learning, you don't need to label the training set anymore. The machine will try to learn by itself without a teacher.

The following are some of the most important unsupervised learning algorithms:

  • Clustering
  • Anomaly detection and novelty detection
  • Visualization and dimensionality reduction
  • Association rule learning

For example, if you have a lot of data of your website's visitors which is a unlabeled training set. Then you could run a clustering algorithm to group different types of visitors. It will find connections between those visitors without your help.

0 人喜欢

评论区

暂无评论,来发布第一条评论吧!

弦圈热门内容

读完了大学依然是社会的底层,那读书的意义是什么呢?

从小学开始到大学毕业,整整16年,读书可以说贯穿了我们每一个人最青春的时候。然而相信很多人都大学以后都会感悟到,自己回学校读书仅仅只是为了一个毕业证,平时要辛辛苦苦的上课,完成各种作业以及学校的要求。结果最后有用的东西没学到多少,时间却浪费在了诸多琐事当中,详细见 中国当前的教育最缺少什么?于是我们不经会想,既然读完书还是底层,还得受社会的毒打,那还读书来干嘛,不如早早的进社会赚取?其实读书对于普通人,尤其是我们底层人而言,好歹也算是条相对公平,且看得到头的出路。对于底层人来说,相对于搞科研、创业、投资等其他出路,读书风险较低、且付出努力能有一定收益。你想想看,如今很多人都觉得读书努力不一定有回报,那更何况其他的出路,风险更是直线上升,所有付出打水漂都算轻的了。除了是一条出路,读书也是教育的一种方式,能让你学习并掌握未来工作生活所需要的某些技能,这无疑有利于你毕业之后的就业问题(虽然学校在培养工作技能方面差强人意)。而且在学校也意味着有很多可能,你可以利用学校的资源去完成一些单独个人完成不了的事情,比如说现在很火的AI大模型,训练一次模型,单单是买GPU就不知道得花多少钱,而且还需要有 ...

如果缸中之脑是真的,那么人就能通过意念改变物质世界?

自从知道“缸中之脑”这个无比形象的词语后,我就对思考这个问题充满了兴趣。所谓缸中之脑是指一个邪恶科学家将一个人的大脑剥离出来,然后放进营养液中,接着通过计算机连接大脑,给大脑发送电信号,让他误以为自己活在某个世界里。这是一个思想实验,该实验的基础是人所体验、感受到的一切都最终会转化为大脑中的神经信号。换句话说,人的对外界的感知是间接的,并不是直接的,而这个间接的桥梁正是大脑的神经信号。这个实验前提可以用不太严格的数学形式表示。假设外界构成一个集合$A$,所有神经信号构成一个集合$B$,大脑世界构成一个集合$C$,那么我们有这样一条公理:公理. 对于任意$B, C$,都存在一个满射$f: A\rightarrow B$,且$B$与$C$之间至少存在一个一一对应$g: B\xrightarrow{\sim} C$。即$C$同构于$A$的一个子集$\widehat{A}$。因此,我们有以下论证:因为缸中之脑和头颅中的大脑接收一模一样的信号,而且这是他唯一和环境交流的方式,从大脑中角度来说,它完全无法确定自己是颅中之脑还是缸中之脑。如果是前者,那它的想法是正确的,他确实走在大街上或者在划船。如 ...

想要实现永生不太可能,但实现长生却是有可能

实现永生可以说是人类祖先的共同梦想,古代中国有秦始皇求长生不老,而各国的宗教也有关实现永生的典籍,可以说实现永生是人类的终极目标。不过在当今大部分人看来,实现永生不过是痴心妄想,然而即便如此,关于延寿的科学研究却依旧在紧锣密鼓的进行,并持续有大量的资金涌入。原因很简单,实现永生不太可能,但是人类却是可以实现长生。自大爆炸理论成为主流科学界所认为的宇宙诞生的方式,至今我们仍不知道未来宇宙究竟会以哪种方式消亡,科学家为此提出了多种猜想(见宇宙的最终结局会是什么?宇宙命运结局的三种假说)。但主流观点仍然是:自这个宇宙诞生以来,所有的事物包括宇宙本身都不可避免的走向死亡。这个世界上不存在不朽的事物,所有事物都会有其消亡的一天。因此,想要永生已经不是寿命能不能比宇宙更长的问题了,而是人类如何在宇宙最后毁灭的时候逃出这个宇宙。宇宙的边界是什么?宇宙的外面是什么?多元宇宙真的存在吗?这些问题直到现在都没有确切答案(参考宇宙无边还是有边?如果人类达到宇宙边界,会发生什么恐怖的事?与宇宙是否真的存在尽头?宇宙边界之外是什么呢?),如果宇宙外面有东西还好,逃出去至少还有一丝希望,而如果宇宙外面是一片虚无, ...

Android Studio安装教程 - Windows版

如果你想要开发Android应用,那么Android Studio往往是必不可少的,其包含Android开发所需要的环境,即便你不打算用Android Studio进行开发,也需要先安装配置好它。首先打开Android Studio中文官网进行下载:https://developer.android.google.cn/studio?hl=zh-cn,下载速度亲测可以,作者今天下载时速度甚至达到了60MB/s。点击下载Android Studio xxx,接着会弹出下载Android Studio的条款及条件。勾选同意后,点击下载Android Studio xxx开始下载。下载完后打开安装包,然后点击Next继续点击Next接着选择好你的安装位置,继续点击Next现在点击Install开始安装耐心等待安装完成安装完成后,点击Next然后点击Finish完成安装等待Android Studio打开。这时会弹出这个收集数据的东西,点击Don't send😎接着进入到Android Studio Setup Wizard的界面,这时如果弹出下图错误,直接点击Cancel即可然后点击Next ...

(✅已修复)弦圈编辑器上传图片已知bug,未知原因导致上传图片模糊

这是个很早之前就存在的bug了,一直都没解决,并且我也不知道具体是什么原因。原本这个bug也只是偶尔发生,已经有很长一段时间没有再遇过了。结果今天我写Android Studio安装教程 - Windows版这篇文章的时候,又遇到这个问题了。刚刚上传前面几张图片的时候一切正常,直到上传最后几张图片时,我发现上传的照片又很糊了,并且无论上传多少次,按多少比例截图,最后结果都一样。而且无论是复制来的图片,还是直接上传图片,都一样。见下面几张图这些图片都是原图很清晰,但上传后就很糊了。目前已确定问题发生在Django后端,具体原因仍在排查当中......更新:经过排查,确定问题跟图片模型有关系,我使用了django-resized的ResizedImageField来将上传的图片转化为webp格式。一般正常使用都是没事的,但是有些时候上传图片的次数多了以后,就会出现这种bug。为什么会出现这个问题,即便我看过django-resized源代码也不清楚,搞不好是pillow的问题?但我觉得应该跟它无关。最后我将ResizedImageField改回了ImageField,然后自己用pillow ...

智力等级体系:天才与超级天才 | 智力修仙

现实中等级体系这个东西非常常见,可以说深深刻在每个人心中,影响着整个社会的运作。数学圈中所谓的鄙视链,即可看作一种等级体系。而在修仙小说中,元婴、化神等各个境界的划分,也是等级体系的一种。这些等级体系其实都是有尽头的,并不是无限往上的,即存在一个最高等级。由于很多修仙作品无限套娃的境界,这让人误以为这是一种失衡的等级体系,或者压根就不能算等级体系。实际上正统的神话中,境界是有尽头的,众神中也存在着最高神。为什么等级体系一定会有最高值,或者说是否等级体系一定会有最高值,这个问题倒是挺有意思的,不过这并不是本文要讨论的重点。我们这次要讨论的是智力的等级体系,这是相较于其他等级体系较少被提及的,即便被提及也没有清晰的划分,定义一般比较模糊且不同人之间差异性较大。本文我们要像小说一样,建立一个完整的智力等级体系,毕竟想要理想上完善这个体系,就必须要考虑到一些超现实的东西。关于智力的度量与划分,基本上都离不开智商这个概念,智商其实就是智力测试的分数。我们首先从智商出发,给出智力等级体系的一个版本。每一级相差30分,意思是上一级的智力跟下一级相比就跟普通人一样。而每一级分为初期、中期、后期、巅峰, ...

回顾经典 - 使命召唤5僵尸模式mod 我的世界

在上一篇文章回顾经典 - 使命召唤5僵尸模式mod 海绵宝宝中,我们介绍了COD5的一个趣味MOD-海绵宝宝。今天我们来介绍一下另一个趣味MOD-我的世界😁。该MOD包含的场景有村庄、地堡、地狱、末地,并且除了普通的Nazi僵尸,还有末影人、烈焰人、末影龙。然后还将一些COD其他系列的武器和饮料搬到这里,还有嚼糖果。该MOD可以通关,通关流程跟MC通关流程一致,即拿到黑曜石打开地狱传送门,前往地狱打烈焰人活得烈焰棒,杀末影人得末影珍珠,回主世界合成末影之眼,前往地堡激活末地传送门,前往末地打败末影龙。该MOD除了MC这种地图外,还有多个其他地图,地图的背景和规则各不相同。当然可玩性最高的还是MC村庄这张地图。除此之外,你可以选择多个游戏难度(solo difficulty): beginner, easy, normal, hard, veteran,难度越低开局初始钱越多,僵尸数量越少,僵尸血量越低,僵尸速度越慢。默认难度是normal,对作者这种萌新而言并不简单,还是beginner舒服😃。并且你还可以修改游戏模式(solo gamemode):original - 正常的僵尸模式 ...

关于弦圈APP帖子附件的下载路径

之前弦圈APP的附件下载路径出现了问题(✔已修复)弦圈APP下载附件功能存在问题,目前暂时无法修复。如若需要下载附件,请先用Web端,现已被修复。现在所有的附件下载完后,都会放在/storage/emulated/0/Documents/Manitori这个文件夹里。需要注意的是,附件下载完后并不会显示在手机的“最近”页中,需要你自行使用文件管理器打开下载路径。 按理来说Documents的意思是文档,里面应该就是专门存放pdf这些文件的,结果却不显示在“最近”页中,也不知道开发手机的是怎么想的😅。不过这是符合某些用户的心意,他们不希望自己下载的东西显示到“最近”,甚至想直接关掉“最近”页。接下来我就给出如何找到下载附件的一个教程吧,防止用户找不到下载的文件。首先在手机桌面找到这个图标的文件打开,如果没有这个图标的文件,可以尝试找名称,见下面这个文件的名称就是文件管理器打开文件管理器后,点击中间的“手机”,然后找到Documents文件夹,打开后找到Manitori文件夹,然后打开即可

这么多个搜索引擎就必应对弦圈最好了,谈谈弦圈过去的SEO经历

早在2024年4月4日弦圈上线之日,我就开始做弦圈的SEO优化,这期间免费付费手段都用过,效果也是起起伏伏。我并不是SEO方面的专家,这篇文章仅仅只是将我过去做SEO的经历说一下,以解释为什么最后我放弃SEO。目前说到SEO优化,一般涉及的就是三大搜索引擎谷歌、百度、必应。其中谷歌全世界体量最大,百度国内体量最大,必应体量没前两者大。如果不考虑国外互联网,仅考虑国内的话,从趋势上看,谷歌对中文互联网不管不顾趋于平稳,百度则正在衰落,而必应则正在增长。在中文互联网中与SEO优化相关的内容,一般说的都是百度SEO或者谷歌SEO,然后大家一致的声音都是百度不行,谷歌行。但网络上的信息往往都有滞后性,加上我是从零开始学习SEO相关知识,总之我持续花了好几个月专攻谷歌SEO,最后都没啥效果。为什么只做了几个月,因为我当时还没大学毕业但也快了。而网上那些所谓的SEO本来就慢,至少一年才有效果等等,在我看来都是p话,先不说我耗不起这样的时间,其次做了那么久那个曝光曲线还是差不多这样,根本没有上升的趋势,我不相信坚持到某天它会突然一飞冲天。期间我试过自己按照网上的教程(国内外的教程都试过),写原创内容 ...

创意总会有枯竭的那天,但创新不会,唯有创新才有可能源源不断、永无止境

根据网上查到的资料,创意这个词是创新的子集:创意是创造意识或创新意识的简称,亦作“剙意”。它是指对现实存在事物的理解以及认知,所衍生出的一种新的抽象思维和行为潜能。但是我认为从实践中讲,更准确地,应该这样定义创意。假设创新是一个集合$A$,那么创意就是任意一个单射$f: B\rightarrow A$且满足$f(B)\subsetneqq A$。By abuse of notation,我们直接将其记作$B$。显然,此定义推广了创意的文字定义。怎么理解这个定义呢?首先两个定义的共同之处是——创意小,创新大。在生产实践中,创意的例子比比皆是,比如说一个商品的包装、一个产品的界面和logo、相同食材的不同煮法等等。这些创意有些是有限的,而有些看似无限其实也是有其上确界。我们可以将这个说法写成一个命题。命题/定义1. 任意一个创意$B$,都存在一个最小实数$M\in\mathbb{R}_{\geq0}$使得$\|B\| \leq M$。此数被称为创意$B$的上确界,并记作$\sup(B)$。为什么说创意是有限的?从生产实践中考虑,绝大多数有创意的产品,经过激烈的商业竞争,在不断的 产生新创意 ...

回顾经典 - 使命召唤5僵尸模式mod 海绵宝宝

使命召唤5虽然是2008年发行的游戏,却是COD系列中最为经典的一个。可以说它是很多玩家的童年回忆,相较于COD的其他版本,COD5可以说拥有最强大的MOD功能,啥都能做成被做成COD5的MOD,即便是COD新版本的僵尸模式也能被做成MOD回到COD5中。得益于此,COD5的僵尸模式至今仍保持着一定热度。曾经COD5的僵尸模式非常火爆,很多MOD如雨后春笋一般涌现,其中不乏一些优秀有趣的MOD,而我今天要介绍的海绵宝宝MOD便是其中之一。这张地图的面积挺大,可玩区域包括:比奇堡小镇水母田音乐会区域高菲高伯冰淇淋船蟹堡王餐厅海绵宝宝的家章鱼哥的房子珊迪的圆顶树屋这种地图包含紧张的跑酷场景,并且有多种饮料,还有特殊的武器。话不多说,直接上图。更多细节介绍、视频,以及下载地址见:Spongebob, Battle for Bikini Bottom [V1.1] LINK UPSpongebob, Battle for Bikini Bottom [V1.1]

(✔已修复)弦圈APP下载附件功能存在问题,目前暂时无法修复。如若需要下载附件,请先用Web端

今天有粉丝反馈,弦圈APP里下载的附件并不能打开。接着我马上打开APP测试,发现文件确实是下载了,但是却找不到下载的文件,这也是当初测试的一个疏漏😢。不过令人沮丧的是,我目前找不到解决这个问题的办法😭。目前这个问题的原因已经查明,就是下载路径的问题。文件下载成功后所放的位置file:///data/user/0/com.sinering.manitori/files,在手机里是打不开的,里面的文件对于用户而言不可见。用户下载的文件相当于存到APP的数据里了,我目前也不清楚如何在手机访问这些文件,开发的时候可以通过Android Studio查看,但是这是真机。由于这是我第一次写APP,自己的技术水平有限,而手机端APP与Web端相比,同样的功能没那么好实现,复杂很多。目前这个问题,我暂时找不到解决办法,其实就是一行代码有问题需要修改。import { File, Paths } from "expo-file-system/next"; const new_file = new File(Paths.document, new_filename);就是上面这行代码里的Paths.do ...

如何创建你的第一个React.js+Vite项目?

最近弦圈APP第一个正式版上线了,在下载弦圈APP这个页面中,GitHub Page的下载页面就是直接用React.js+Vite写的:https://ricciflows.github.io/xianquan-app-download/。那么,对于新人小白而言,如何创建第一个React.js+Vite项目,并写出这样一个简单的页面呢?本文将手把手教你如何实现。首先,你需要安装并配置好node.js环境,具体见Node.js安装与更新教程 - Windows版,并确保node版本是18+或者20+。接着win+R并输入cmd打开控制台(如果你想要选择项目的位置,如D:\Reactjs,则分别输入D:和cd Reactjs)然后输入命令npm create vite@latest如果输出以下结果,则输入y然后按enter键接着输入项目名称,如vite-test按方向键↓,选择React,然后enter接着,根据自己的需要选择。这里我们选择第一个然后根据提示,分别输入三条命令。第一个命令是指进入项目文件vite-test,第二个命令则是安装所有npm依赖,第三个命令则是运行测试模式。注:输 ...