文|鄰章
一直以來,用AI工具進行文學創作都是科技公司們樂于嘗試的事情,特別是在如“高考”這種全民關注的特殊時間節點,用AI撰寫高考作文等就更被科技公司追捧。
今年,明爭暗斗或更勝以往。
核心原因當然是自去年Open AI以生成式AI應用ChatGPT以近乎于質變的能力,引發全球生成式AI大模型狂熱,讓大家公認AI技術來到了“iPhone”時刻。?
國內科技互聯網公司們也紛紛跟進并在今年拿出了自家的生成式AI大模型產品—— 據不完全統計:從今年二月至今,國內AI大模型發布會就開了接近20場,諸如百度文心一言、阿里巴巴通義千問、科大訊飛星火大模型等,并都幾乎對外宣稱 自家產品技術具備領先性。
在此,“高考作文”這一綜合考驗考生材料理解能力、文字功底、思辨能力、文字創新能力的綜合考題,無疑也是檢驗各家大模型技術創造能力的試金石。
也正是基于此,投身于生成式AI大模型的廠商們,也是摩拳擦掌,準備一展自家生成式AI大模型的文學創作能力。
諸如周鴻祎在微博就分享了一篇由360智腦創作的今年全國甲卷高考作文。
但從最終結果來看,其表現是基本功不錯但在思辨性層面則不足,也較難拿到高分。
語文特級教師王大績在微博中對360智腦生成的這篇AI作文點評稱:“作文語言曉暢,層次清晰,寫作基本功很好,在基礎等級的層面,表現不錯。作文也談到了高科技,但是對科技發展條件下,本應成為時間的主人,何以卻成為時間的仆人,未能抓住關鍵,思考不夠透徹,因此未形成鞭辟入里的辨析,題目所要求的時代感比較淡泊,在發展等級方面,表現一般?!?nbsp;
事實上,這種在文學創作層面思辨性不足的現實,不止是360智腦一家,其實幾乎是當前生成式AI大模型的“通病”。
在搜狐科技以高考作文全國卷(甲)為題,對 百度文心一言、阿里通義千問、科大訊飛星火認知大模型、360智腦、ChatGPT五款主流大語言模型產品進行同題測試,并邀請到五位語文名師進行點評各模型生成作文水平的活動中,就不難發現:五款大模型基本都理解到了高考作文全國卷(甲)的作文立意,沒有出現偏題、跑題現象,也都能在短時間內生成相應文章。
但同時大模型們也存在著對作文具體要求理解不清(諸如創作的文章字數未達到不少于800字的要求)、行文死板、割裂感明顯、語言空洞、“理工味”明顯;并且更為重要的是它們創作的文章,都普遍存在著論點論據不足、觀點不新穎等在文學創作上最為致命的問題,這也導致這五款大模型創作的高考作文,綜合得分最高的ChatGPT,也只拿到了48分。
坦率來講,ChatGPT的48分和百度文心一言的46.5分,在高考作文得分中,其實也不算低,甚至可能會超過許多考生的作文得分,但也與優秀作文沒有沾不上邊,只能說是較為普通的水準。
而這些大模型在文學創作上暴露出的這些問題,也讓我們看到當前生成式AI技術的不足,甚至可以說,那些叫囂著現在ChatGPT等生成式AI技術就能進行文學創作,取代創意人員的話語,著實有些夸大其辭乃至危言聳聽了。
當然,我們也不否認ChatGPT等生成式AI技術在持續養料喂養下,能夠迅速成長的潛力,但要擺脫當前大模型在文學創作中存在的創造性不足問題 ,可能也并不是大模型們一朝一夕就能搞定的事情,其可能還需要較長的時間。
在此,幾乎可以說:在看過用生成式AI作答的高考作文后,我認為對AI取代文學創作的鼓吹也好,恐懼也罷,其實都可以暫時先緩一緩了。
寫在最后:
ChatGPT等大模型技術所具備的郵件&新聞&論文撰寫、視頻腳本、文案、翻譯、代碼編寫等能力,讓生成式AI技術在很大程度上超越了過往這類AI應用偏娛樂的屬性,進入了真正的生產力乃至是創造性階段。
由此 也有不少業內驚呼 : 創造性工作機會,可能會被GPT們率先取代了,開始陷入悲觀預期。
事實上,對于生成式AI技術展現出的實力,我一直以來的觀點都是:既沒必要過度鼓吹,同時也沒必要過度恐懼,以一顆平常心去對待技術的發展更迭,或許會更好。
站在技術浪潮面前,我們更應該做的事情是,及早的學會善用這些技術,以助力我們工作效率與生活質量的提升。
鄰章微信:ZLxgic,公眾號:TMT317