在中小學(xué)普及人工智能教育不僅需要合適的工具和課程,還需要本地的人工智能教學(xué)平臺。各種人工智能實驗的開展,都需要借助特定的軟硬件環(huán)境支持。OpenHydra是在這一背景下推出的國產(chǎn)開源項目,用于搭建一個本地的人工智能教學(xué)平臺。本文分析了中小學(xué)人工智能教學(xué)平臺的核心功能,并介紹了在一臺算力服務(wù)器上快速搭建OpenHydra的過程,最后對OpenHydra項目提出了新的期望。
當(dāng)數(shù)據(jù)、算法和算力被公認為是人工智能時代的三駕馬車時,這就意味著生物啟發(fā)式方法(搭建深度神經(jīng)網(wǎng)絡(luò)并在數(shù)據(jù)中獲取智能)已經(jīng)成為人工智能最重要的研究范式。中小學(xué)人工智能教育需要密切圍繞“模型”開展,不能僅停留在體驗和應(yīng)用模型層面,還要嘗試收集數(shù)據(jù)并訓(xùn)練、部署模型,在親歷“智能從無到有”的流程中理解模型。令人驚喜的是,隨著以Keras、XEdu為代表的人工智能學(xué)習(xí)和開發(fā)工具的出現(xiàn),學(xué)生只要借助少量代碼甚至不寫代碼就能訓(xùn)練出人工智能模型。如果擁有合適的數(shù)據(jù),完全可以做到解決各種真實問題。
基于這樣的認識,筆者在建設(shè)學(xué)校人工智能實驗室的時候,申報了一臺擁有兩塊英偉達4090顯卡的算力服務(wù)器。經(jīng)過一段時間的研究,終于在開源項目OpenHydra的支持下,搭建了局域網(wǎng)版本的人工智能教學(xué)平臺,讓一個班級的學(xué)生共享服務(wù)器算力,借助瀏覽器即可完成常見的人工智能實驗。
中小學(xué)人工智能教學(xué)平臺的核心功能分析
大部分人工智能學(xué)習(xí)和從業(yè)者往往是借助商業(yè)云算力來開展各種實驗或者工作,但與高校不同的是,中小學(xué)人工智能教育往往在課堂上完成,對教學(xué)時間的把控要求比較高,而商業(yè)云算力并沒有提供適合中小學(xué)的容器(學(xué)習(xí)環(huán)境),用戶需要從零開始配置環(huán)境。最麻煩的是,在做深度學(xué)習(xí)實驗時還需要在服務(wù)器和本地之間傳輸大量的訓(xùn)練數(shù)據(jù)。因此,商業(yè)云算力的方案對中小學(xué)來說并不適合,有條件的學(xué)校需要本地搭建內(nèi)置算力的教學(xué)平臺,而這一平臺除了能夠提供教學(xué)資源和學(xué)生管理外,還能進行算力分割和學(xué)習(xí)環(huán)境管理,這是它的最核心的功能。
1.算力分割管理
雖然借助XEdu一鍵安裝包,在任何一臺win7以上電腦上都可以開展人工智能教學(xué),但是訓(xùn)練模型僅限于CPU環(huán)境,做對算力要求不高的機器學(xué)習(xí)和全連接神經(jīng)網(wǎng)絡(luò)的實驗。至于基于卷積神經(jīng)的圖像分類和目標(biāo)識別實驗,沒有支持CUDA(NVIDIA推出的通用并行計算架構(gòu))的GPU設(shè)備,一節(jié)課很難完成教學(xué)任務(wù)。從性價比和維護難度看,買一臺算力服務(wù)器比為每一臺學(xué)生電腦配置GPU的做法要更合適。
需要強調(diào)的是,人工智能教育并不是針對少數(shù)人的高端課程,大部分學(xué)校的人工智能課是面向一個班級開展的。因此,用于教學(xué)的算力服務(wù)器需要支持30~40人的并發(fā)量。一般來說,一塊24G的顯卡一般可以切分為4份來使用,這樣一計算,支持一個班級至少需要2~4塊顯卡。即便如此,40人的班級還要分組,讓2~3人使用1個GPU容器,畢竟GPU設(shè)備太貴了。
2.學(xué)習(xí)環(huán)境管理
這里的“學(xué)習(xí)環(huán)境”指的是人工智能的開發(fā)和訓(xùn)練環(huán)境。眾所周知,搭建環(huán)境能勸退90%以上想學(xué)習(xí)人工智能的人。因此,用Docker容器預(yù)先安裝好各種相關(guān)開發(fā)框架、工具和Python庫,成為一種通用的選擇,絕大多數(shù)的商業(yè)云算力平臺都選擇了內(nèi)置Docker容器技術(shù)。所謂Docker容器,類似一臺無桌面系統(tǒng)的虛擬機,借助交互API,即可在瀏覽器上編寫代碼,在遠程容器上運行,再返回到瀏覽器上呈現(xiàn)。這個過程對學(xué)生用戶來說是透明的,與本地操作沒有區(qū)別。
目前,適合中小學(xué)生學(xué)習(xí)人工智能的環(huán)境有XEdu等。XEdu實際上是由MMEdu、BaseML、BaseNN和XEduhub等一系列Python庫組成的,涵蓋了Pytorch和sklearn等必備的人工智能學(xué)習(xí)框架。除此之外,Keras和PaddlePaddle也值得作為學(xué)習(xí)環(huán)境,完成一些特定的實驗。為了避免Python庫的版本沖突,這一平臺最好能支持多個容器。
用OpenHydra搭建人工智能教學(xué)平臺的過程
OpenHydra是一個開源項目,旨在為中小學(xué)AI教育提供一個開箱即用的學(xué)習(xí)與實踐平臺。它是基于K8S(全稱Kubernetes,一個用于管理容器的開源平臺)開發(fā)的系統(tǒng),默認內(nèi)置了最新版本的XEdu。OpenHydra的開源地址:https://github.com/openhydra/。
1.服務(wù)器軟件準備
對于熟悉算力管理的高手來說,可以在K8S系統(tǒng)上直接安裝OpenHydra的插件。對中小學(xué)來說推薦使用編譯好的OpenHydra鏡像文件來安裝。只要將編譯好的ISO文件燒錄到U盤上,然后用這個U盤系統(tǒng)引導(dǎo)電腦啟動,即可一步一步完成OpenHydra系統(tǒng)的安裝。
2.啟動服務(wù)器并設(shè)置IP地址
全新安裝OpenHydra實際上包含了安裝Ubuntu(版本為server 20.04.06)和OpenHydra兩個環(huán)境。安裝過程類似對一臺新電腦安裝系統(tǒng),關(guān)鍵操作是設(shè)置IP地址、指定磁盤和用戶名。從系統(tǒng)引導(dǎo)開始計時,安裝時間預(yù)計20~30分鐘。需要強調(diào)的是,磁盤的數(shù)據(jù)要及時備份,安裝過程中會初始化磁盤。
3.測試教學(xué)平臺
在系統(tǒng)安裝完成后,重啟電腦后在顯示器上看到如下圖所示的信息,說明一切準備就緒,不需要再做任何操作,就可以開始上課了。
用其他電腦打開瀏覽器,輸入服務(wù)器地址和30001端口,如“http://192.168.3.233:30001”,就能看到OpnHydra的登錄頁面,如下圖所示。
教師在上課之前,首先需要配置學(xué)生賬號。“設(shè)備管理”頁面將列出所有的用戶登錄和使用情況。
對學(xué)生而言,在OpenHydra上打開實驗環(huán)境,將啟動jupyter頁面(如下圖)。
對OpenHydra的更多功能期待
經(jīng)過測試,OpenHydra的安裝和配置簡單,界面友好,很好地解決了算力分割的問題。但因為項目剛剛發(fā)布,還需要進一步完善。目前,OpenHydra社區(qū)匯聚了大量開源的AI開發(fā)工具和AI教學(xué)實踐項目,尤其期待多方力量的加入,讓這個系統(tǒng)能實現(xiàn)更多的功能。
1.支持更多的容器環(huán)境
如下圖所示,目前OpenHydra的內(nèi)置容器只有XEdu標(biāo)準版,還需要加入Keras、PaddlePaddle的容器。即使XEdu版本也應(yīng)該有IOAI版本(AIO奧林匹克專用)、不同的教材版本等。甚至一些用戶數(shù)量較大的課程也可以封裝為一個獨立的版本。這些容器可以由管理員或者教師來手動更新,自由選擇。
2.支持在線更新課程資源
目前,OpenHydra團隊提供了課程模板,按照一定規(guī)范即可為這個項目提供標(biāo)準課程。但是,人工智能的課程往往會內(nèi)置特定的數(shù)據(jù)集,而深度學(xué)習(xí)的數(shù)據(jù)集都很多,少的數(shù)百張圖片,多的數(shù)萬張。那這些課程資源存放在哪里?如何更新?如果不設(shè)計在線增量更新的方式,肯定會限制后續(xù)的發(fā)展。
3.支持更多算力設(shè)備
眾所周知,GPU設(shè)備是最昂貴的。目前,一些國產(chǎn)的通用GPU設(shè)備也兼容CUDA,因為中小學(xué)的人工智能實驗不會追求最新的技術(shù),往往會選擇一個最常用的計算框架版本,不需要實時更新。所以,只要做好一次適配,就能用較長一段時間。這個適配工作意義很大,但需要算力企業(yè)的支持。
4.支持各種教學(xué)插件開發(fā)
中小學(xué)一旦普及人工智能教育,各種需求就自然而然產(chǎn)生,如用戶通用認證、數(shù)據(jù)標(biāo)注、作業(yè)評價、特定的教學(xué)活動支持等,這些功能應(yīng)該以插件的形式吸引有能力的企業(yè)創(chuàng)客和教師開發(fā)。
總結(jié)
鐘柏昌教授提出,要開展中大型深度學(xué)習(xí)模型的訓(xùn)練和部署,除了利用云服務(wù)器外,未來開展大規(guī)模常態(tài)化人工智能課程教學(xué),離不開學(xué)校本地服務(wù)器的算力資源,而這種算力資源要同時滿足幾十上百個模型的同步訓(xùn)練,又離不開算力資源的合理分割。人工智能的發(fā)展離不開教育,而教育需要更好的工具,OpenHydra項目不僅可以用于中小學(xué),而且適用于一些規(guī)模較小的高校實驗室。因此,我們對OpenHydra項目的發(fā)展充滿了期待。
本文作者:
謝作如
浙江省溫州科技高級中學(xué)
文章刊登于《中國信息技術(shù)教育》2024年第07期
引用請注明參考文獻:
謝作如.用OpenHydra搭建本地人工智能教學(xué)平臺[J].中國信息技術(shù)教育,2024(07):74-76.
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 舉報,一經(jīng)查實,本站將立刻刪除。