手机浏览器扫描二维码访问
一秒记住【xiaoyanwenxue.com】精彩无弹窗免费!“重生学神有系统(.shg.tw)”!
不过,在跑代码之前,还要对数据进行预处理。
江寒先从报名信息表中,将性别信息仍然“健在”的行挑出来,只保留序号、姓名和性别,另存为label.xls。
这些记录一共9527条,大约占三万多条数据总数的30%。
它们对应着9527张真彩色照片。
24位真彩色的图片,每个像素点在内存里,要占用3个字节的存储单元。
每张照片有210×120个像素,这样读入一张照片,需要的内存空间就是210×120×3=75600个Byte。
9527条数据,共需要9527×75600=720241200B≈686.88M≈0.7G!
这个内存开销,还是比较容易接受的。
但是,“感知机”的算法,需要进行大量浮点乘法运算。
对每个像素的每个RGB分量都算一遍?
没那个必要,也太浪费时间。
所以,聪明的做法,是先把照片数据“压缩”一下。
江寒给“感知机”的代码,添加了一个LoadData函数,用来读取和处理照片数据。
在这个函数里,先定义一个二维的整形数组Feature。
然后从label.xls中读出序号、姓名信息,按照刚才建立的索引表,找到对应的照片文件。
下一步,将照片读取到内存中,读取的同时,将每个像素二值化。
具体做法是:色彩浓度在阈值以上的像素,取值为1,低于阈值就让它为0。
这样一来,原本的真彩色照片,就被转换成了黑白轮廓图。
然后,再将轮廓图中的0或者1的取值,按照从左到右、从上到下的顺序,重新编排成一行数据,存放到数组Feature中。
Feature中的每一行,都存储了一张照片的二值化信息。
一共9527张照片,就需要9527行。
全部照片处理完毕后,就得到了一个巨大的二维数组Feature。
它有25200列、9527行。
接下来,定义一个拥有9527个整形元素的一维数组Label。
从label.xls中读入性别信息,男生设为1,女生设为0,存放在数组Label中。
Feature加上对应的Label,就构成了训练数据集。
训练“感知机”时,将一行行Feature代入公式中,进行加权和运算,其结果再通过sign函数,转换为0或1,然后和对应的Label值对照。
如果不相符,就调整权重和偏置,然后重新计算。
当每一个Feature代入公式后,都能计算出正确的Label时,就得到了一组权重和偏置。
也就是说,构建出了一个可用的数学模型。
依据这个模型,计算机就可以读入任何一张同尺寸、类型的照片,对其二值化的数据代入模型中运算,并根据运算结果判断分类归属。
这就是典型的机器学习过程,计算机从数据中自己“学”到了某种规律。
动漫时空巡逻队 封天之圣 人在综漫:开局选择日之呼吸 修仙大佬,求你别秀了 荒山远海 末世进化之王 一胎三宝:战神妈咪她A爆全球 山河万里不识君 最强司机 都市豪门战神 柳定大荒 风水赘婿 爷爷给我算了最后一卦 玄幻之无上天帝 玄武戴孝快封村 她做了一个可预测未来的梦 秦朝之天明崛起 天降六宝:夫人她千娇百媚 李长风萧玉如 遗世有情之有狐
我曾一人独活在史前地球,我经历过侏罗纪,曾亲眼看着小行星灭绝了一个时代。我曾穿梭诸天万界,世人尊我为太上至尊!我之大道,随心所欲,为所欲为!陈正与至高无上一战,让纪元重启,回到了地球某个时间节点!他虽然被削弱了修为,可肉身与元神不死不灭,带着过去几十亿年的经历,轻松纵横都市,游戏人间!...
...
校园征文中短篇虫族倾巢出动,星际不败战神战栩翻车了,险些丧命他被个女人救下,她,冷酷无情,只知道催债战将军不近女色,是个训练狂魔,然而一醒来居然忘掉了自己是谁他眼巴巴望着江祈,不要脸地问你一定是我的亲人吧?做的饭真香苏祈表示病的不轻江祈把粥推到他面前在江家吃白饭的战神一碗饭吃不饱哦江祈那你要几碗五碗江祈战神满足的吃着有老婆真好,有老婆真妙,没老婆的日子很煎熬!江祈冷漠地看着那堆空碗记账人虫大战中,她挺身而出,把他护住躲我背后战神乖乖照做,眼睛亮了软饭好香~一直下落不明的战神突然出现,众老婆粉刚想激动尖叫却知他已非单身,愤怒不服,来战。江祈以一敌百,横扫千军,无人能敌,举出战无不胜的大旗老婆粉们沉默战将军,不配的是你战栩竖起大拇指软饭,真滴香深情将军VS冷血海盗美人...
看小小庶女如何名动京城,富甲一方!...
身为赘婿,意外获得选择系统,从此咸鱼翻身。才华?力量?财富?美女?全给我选了!我通通要!敢惹我,给你两个选择,跪下,或者死!...
救父亲性命的一个肾换了江棉的一场荒唐婚姻。遭遇丈夫背叛,小三算计,江棉一夜之间一无所有,还失去了那个代孕的孩子,而孩子的父亲,她根本不知是谁!她只想好好守护和她血脉相连的宝宝,却在日夜相处之中与他纠缠越陷越深。为了孩子,她不得不坚强!...