虽然咱不参加高考,但每年还是会例行关注一波高考作文题。毕竟都是被虐过的人,依稀还记得那些年的「丝瓜藤和肉豆须」、「举报我爹开车打电话」、「齐桓公、管仲和鲍叔」......
而高考前,除了老师和考生,吃瓜群众也会积极投身于「语文作文押题」这一重大工程中。
最近就有一位B站UP主 @图灵的猫 整出了新活,用AI预测出了今年高考最有可能出现的7大命题。
在视频里,UP主分别展示了这7个命题的「核心词」、「预测主题」和「模型表征」:
困难、希望
拼搏、自强
探索、梦想
创新、发展
奋斗、价值
公平、德育
美、环境
怎么样,是不是很有内味儿?
那这个预测模型是如何工作的呢?据UP主介绍,与人工命题需要从大量热点事件、政策文件中提取和筛选主题、进行命题类似,AI也需要从大量数据中挖掘规律,获取的数据越多、分布越合理,预测的准确性也会越高。
为了获取尽可能多的数据,UP主专门写了一套爬虫,来爬取过去一年内人民日报、人民网、央视新闻等官媒所发表的文章、期刊和报纸,以及高层会议的重要文件和讲话。
之后,通过自然语言处理中的预训练模型以及主题建模算法,这套AI系统可以理解中文语境下的新闻与文章,以此学习并模仿过去几年的高考作文出题思路,结合过去一年中最为重要的事件脉络,提炼成最终的题目短语。
不过,近年来的高考作文命题越来越向人生价值观、家国情怀等「大格局」主题靠近,所以,类似于(以前的)江苏卷和上海卷那样思辨性强的作文题目,不在UP主的预测集范围内。
UP主已将这套算法的代码开源在了Github上,传送门:https://github.com/EssayKillerBrain/EssayTopicPredict
此视频一出,引发了B站网友的大量讨论。考研党、考公党纷纷求预测考研英语作文题、考研政治题、公考国考题之类,这些题目与如今的高考作文命题的确有相似之处。
当然还有很多抱有正确金钱观的人士(如本人)想要AI来预测彩票开奖。
爱抖机灵的网友也已经开始替命题组紧张了,不过,也许命题组早已经用了另一套算法来反预测呢。
还有人在基于这些预测结果对全国卷的作文展开更具体的预测。
至于预测结果的准确性,还要等到两天后见分晓,不过很多考生表示,在模拟考中他们的确已经遇到这些预测出来的主题,也都在自己老师预测到的范围内。
但从另一个角度看,这种预测结果似乎有点「听君一席话,如听一席话」了,这些核心词和主题都是过去一年的热点,不用AI,我也能押...而命题组不按常理出牌也是常有的事,重点划得太多,相当于没有重点。
也有网友怀疑预测结果是不是过拟合了,毕竟有些热点事件在新闻中的存在感很强,但与语文作文命题的关联性也许并不大。
另外,对于帮助人类写作文、批改作业、预测考题等AI产品,我们也要考虑用途正当性的问题。
正如UP在视频中所提到的,类似的AI模型一经出现,就会被很多嗅到商机的人利用去牟利,去二手交易平台逛一逛就会发现,已经有很多人在卖各种「写作神器」、「AI文章自动生成器」之类的,而有些就是完全复制自这位UP主之前开发出的AI写作文的模型,所以还存在知识产权难以得到保护的问题。
对于我们大多数人来说,还是有用则用,无用就图一乐吧~
最后,我们祝全国考生旗开得胜,金榜题名。