欧美国产一区二区三区,日韩欧美一区二区三区电影,欧美日韩久久久久,激情国产精品,欧美精品久久一区二区三区,亚洲一区二区三区在线电影,久久亚洲欧美

第4章 審題

行云流水 飛鳥(niǎo) 657587 字 2024-11-26 09:15:58
>>> 戳我直接看全本<<<<

即便有算力系統傍身,可是光有算力是不夠的。

算力只是計算的能力而已,沒(méi)有算法的加持,算力等于是零。

就好比:你不可能光靠著(zhù)汽油去詩(shī)和遠方,你必須得有一輛汽車(chē),然后那些汽油才能發(fā)揮作用。

而本就是本二水準的林遠對于算法一道并不精通。

其實(shí)這也很好理解。要是林遠天生聰慧,當年高考也就不會(huì )考個(gè)本二了。

因而林遠能拿到紫金航校計算機專(zhuān)業(yè)的面試資格全然是靠算力系統的指引。

是算力系統為他規劃好了學(xué)習路徑,找對了每一科的教材,才讓林遠的學(xué)習事半功倍。

所以,林遠不得不面對一個(gè)事實(shí):其實(shí)他自己挺菜的。

畢竟智商這個(gè)東西吧,真不是看幾本書(shū)就能有啥質(zhì)的提升。

-----------------

經(jīng)過(guò)了兩分鐘后,林遠的古董T440總算開(kāi)機完成。

如果這時(shí)候上面裝了630安全軟件,那一定會(huì )在右下角顯示:您的開(kāi)機速度打敗了全國X%的用戶(hù)(X一定是個(gè)位數)。

依照慣例,林遠沒(méi)有在開(kāi)機完成后的第一時(shí)間就點(diǎn)開(kāi)他的python開(kāi)發(fā)環(huán)境--pycharm。他又給了T440一分鐘時(shí)間“冷靜冷靜”。因為一臺古董機的真正開(kāi)機完成往往并非如它所展示的那樣。

足足三分鐘后,pycharm的圖標終于被打開(kāi)。

【loading project。。?!拷又?zhù)的是龜速的加載過(guò)程。

隨后,林遠終于打開(kāi)了他的OCR識別項目。

沒(méi)錯,他直接套用了現成的項目代碼。

這并非是他作弊。

事實(shí)上就在剛剛,張教授特地跑到每一個(gè)教室來(lái)說(shuō)了一遍,“這次上機考核不同于以往,除了不允許交頭接耳抄襲代碼之外,隨便你們上網(wǎng)查閱資料。你們可以參考任何開(kāi)源項目?!?/p>

張教授甚至貼心地把寫(xiě)有校方WiFi名稱(chēng)和密碼的白紙,用磁吸貼在了黑板上。

“但有一點(diǎn)。千萬(wàn)不要自作聰明,別以為拿別人代碼改改我們就看不出來(lái)。我最近正在做一個(gè)用AI技術(shù)判定代碼抄襲的課題,但愿你們不要給我提供AI訓練的素材?!?/p>

既然連參考開(kāi)源項目都不成問(wèn)題,那直接套用個(gè)人過(guò)往項目自然更加不在話(huà)下。

不過(guò)所謂套用,卻遠非是簡(jiǎn)單的復制黏貼。

在林遠看來(lái),所有AI訓練的過(guò)程都可以被抽象為:采集數據==》訓練數據==》計算誤差==》回饋誤差。

雖然這次考核沒(méi)有解釋的太詳細,但是林遠憑借這半年來(lái)的刻苦學(xué)習已然完成了第一步--審題。

任何考試的第一步永遠是審題,很多所謂的難題往往審題占了很大的比重。

而以這間教室里不少人緊皺的眉頭來(lái)看,他們看樣子是連第一關(guān)都沒(méi)過(guò)。

考題是讓大家用原創(chuàng )方法實(shí)現OCR字符識別,但卻沒(méi)有詳細指定哪些范疇算是原創(chuàng )的。這是這次考核的第一道面紗。

如果真的從“數據采集”階段完全原創(chuàng ),那可以洗洗睡了。

林遠大致估算了下,如果從頭開(kāi)始每一行代碼都是原創(chuàng )的,那今天大家就要留在這間教室過(guò)夜了。

可是他剛剛就有環(huán)顧四周,顯然校方?jīng)]打算留他們過(guò)夜。校方甚至沒(méi)打算留他們吃晚飯。

此刻的時(shí)間大致是下午兩點(diǎn),那這次考核的時(shí)長(cháng)也就是三四個(gè)小時(shí)。

林遠心道:‘這考核也太隨性了,鬼知道是哪個(gè)混蛋想出來(lái)的?!?/p>

既然考核只有三四個(gè)小時(shí),那考核必然有考察的重點(diǎn)。

林遠仔細思索了一小會(huì )兒。

對于OCR字符識別來(lái)說(shuō),采集數據特征完全就是公式化的步驟。因為OCR識別不是什么新的領(lǐng)域,那必然就不可能是考核的重點(diǎn)。所以,這部分代碼,抄就完事兒了。

剩下的計算誤差和回饋誤差,也沒(méi)什么可創(chuàng )新的。更準確來(lái)說(shuō),校方這整的是研究生入學(xué)考核,又不是招募國寶級科學(xué)家,難道還指望通過(guò)這次考核發(fā)現什么天才?

所以,這次考核的重點(diǎn),必然是聚焦于考察考生平日里的修行。

簡(jiǎn)單來(lái)說(shuō),就是考察你平時(shí)都在干些什么。對計算機和AI到底感不感興趣啊。如果你感興趣,那你就肯定會(huì )經(jīng)常寫(xiě)寫(xiě)代碼。經(jīng)常寫(xiě)寫(xiě)代碼那自然就會(huì )很熟練。

而興趣是科研的首要條件。

雖然林遠此時(shí)并沒(méi)有對科研報以很大的興趣,但是他對通過(guò)走科研一途改變命運很有興趣。

嗯~~,也算是殊途同歸吧。

既然要考核平日修行,又不指望你水平能有多高。那自然也就不可能去考核計算誤差和回饋誤差這兩個(gè)步驟,因為這兩個(gè)步驟有太多現成的套路方案,體現不出人與人的差異性。

那就只剩最后一個(gè)步驟--訓練數據。

這個(gè)步驟綜合了線(xiàn)性代數、微積分、計算機編程能力、圖像學(xué),算是很綜合的一個(gè)步驟。

‘一定是這樣的?!诌h思慮既定,當即快速定位到原有項目工程中“訓練數據”部分的代碼。他打算重構這部分代碼,至于其它部分的嘛,就原封不動(dòng)了。

林遠接著(zhù)深入思考。

現今的AI訓練無(wú)非就是基于深度神經(jīng)網(wǎng)絡(luò ),但是總共也就才三個(gè)多小時(shí),既要寫(xiě)代碼又要調試出結果,根本就不可能把網(wǎng)絡(luò )設計的有多深。

而在了解圖像基本原理,掌握線(xiàn)性代數和微積分的基礎上,如果用現成的數學(xué)計算工具庫。比如:tensorFlow或者pytorch搭建一個(gè)三層左右的神經(jīng)網(wǎng)絡(luò )。三個(gè)小時(shí)時(shí)間夠好差不多。

至此,林遠恍然了。

‘審題結束。原來(lái)就是一道綜合考查題。出題人挺壞的,算是把應試的人徹底篩出去了。名校的研究生入學(xué)考試,果然不是光靠做題就行的?!?/p>

得益于往日里對OCR識別項目的了解,林遠自信兩小時(shí)就能完成代碼編寫(xiě)和調試。

可麻煩的是這臺T440沒(méi)法用GPU訓練。

現代的AI訓練用數學(xué)工具庫需要的硬件入門(mén)條件太高,林遠無(wú)奈只得轉而用CPU跑訓練。

他并未因此有什么擔憂(yōu),因為訓練的過(guò)程是持續的。只要訓練出的結果誤差在不斷縮小,那即便時(shí)間上來(lái)不及,也能通過(guò)展示出來(lái)的潛力來(lái)讓老師們同意延長(cháng)時(shí)間。

這就好比在爬山的時(shí)候,雖然還沒(méi)有看到云遮霧繞的山頂,但通過(guò)腳底的感受就能清晰知道:此刻所處的地方并非是山頂,上面還有更高的地方。

由于這次考核的參試者每個(gè)人的筆記本性能都是不一樣的,因此林遠篤定:考核的重點(diǎn)決對不會(huì )是訓練時(shí)間的長(cháng)短,而是最終訓練結果的準確率。

也就是說(shuō):這次考核不是考你爬的有多快,而是考你最后能爬的多高。

念及于此,林遠不自禁嘴角一笑,‘難怪剛剛那個(gè)張教授一直強調的是結果的準確率?!?/p>

他的推測和張教授起初公布的評判結果完美匹配上了。

思慮既定,林遠隨即開(kāi)始了忙碌的復制+黏貼。


更新時(shí)間:2024-11-26 09:15:58