?數(shù)智賦能法律史的學(xué)科與方法革新
2025-10-17 10:43:51 來源:法治日報·法治周末
古今之間一線牽,在法律歷史中尋找規(guī)律、理解當(dāng)下,是法律史研究的核心追求。人工智能技術(shù)的賦能恰為這條貫通古今的脈絡(luò)注入了新的生命力。它不僅能夠推動法律史數(shù)據(jù)庫的數(shù)智化,高效處理浩繁的法律史料,提高法律史知識的可獲得性,更助力法律史研究方法更為多元,拓展“遠(yuǎn)讀”視角,深化我們對傳統(tǒng)法律與治理邏輯的理解

□陳新宇 劉穎
人工智能(AI)的應(yīng)用在社會全領(lǐng)域掀起了變革,并深刻重塑著法學(xué)研究與實踐的圖景。無論是法律實踐層賦能司法實務(wù)的輔助審判系統(tǒng)、智能法律咨詢系統(tǒng),還是法學(xué)研究層對于權(quán)利主體、算法歧視、人工智能侵權(quán)等一系列新興法律問題的熱烈討論,抑或是法學(xué)教育層新設(shè)數(shù)字法學(xué)二級學(xué)科以培養(yǎng)兼具技術(shù)素養(yǎng)與法律思維的新型法學(xué)人才,法學(xué)各領(lǐng)域無不在積極融入人工智能浪潮。然而,在法學(xué)與人工智能深度融合的大潮中,作為法學(xué)學(xué)科之一的法律史卻相對沉默。
當(dāng)然,這并非意味著法律史與人工智能之間存在難以逾越的隔閡,相反,討論與探索二者的結(jié)合尤為重要:其一,從學(xué)科特點的角度,法律史多年來一直存在某種“危機(jī)論”,對此盡管仁智互見,但順應(yīng)時代洪流,與人工智能展開對話并促進(jìn)研究范式更新,提高對法學(xué)知識共同體的貢獻(xiàn),不失為化解危機(jī)的一種重要路徑。其二,從自主知識體系的角度,人工智能時代法學(xué)自主知識的生產(chǎn)要植根于傳統(tǒng)法律制度和優(yōu)秀法律文化,中國法學(xué)在人工智能時代的全球話語權(quán),與能否將法律傳統(tǒng)數(shù)智化地納入全球數(shù)據(jù)庫與比較法研究框架關(guān)系密切。
融貫古今:法律史數(shù)據(jù)庫的數(shù)智化建設(shè)
作為法學(xué)與史學(xué)的交叉學(xué)科,法學(xué)學(xué)科的法律史雖以法學(xué)視角和方法為主,但無論是其研究的問題意識還是推論過程,都必須建立在扎實的史料之上。由此,閱讀、選取相關(guān)法律史史料,從內(nèi)容、邏輯上進(jìn)行梳理,是法律史研究的基礎(chǔ)課題。然而,面對數(shù)量龐大的律例、會典以及分散的奏折、判牘等法律史料,搜索和整理工作耗時耗力。雖有如陳寅恪一般學(xué)富五車、中西貫通的大家,但如果要促進(jìn)整個學(xué)術(shù)研究的普及與深化,有必要將法律史文獻(xiàn)化“死”為“活”。
中國古代已有學(xué)者嘗試對古籍經(jīng)典作系統(tǒng)的整理以便于世人檢索。例如,汪輝祖匯集“二十四史”中記載的人物,按姓氏標(biāo)記,收錄成冊,依照韻部分類編排,完成《史姓韻編》一書。雖然這類工具書在古代的出現(xiàn)十分零散,編纂方法也不夠科學(xué),但無可否認(rèn)是以個體之力助力古籍系統(tǒng)整理的有益嘗試。
在“整理國故”的號召下,從哥倫比亞大學(xué)畢業(yè)、在燕京大學(xué)執(zhí)教的洪業(yè)提議并促進(jìn)了哈佛燕京學(xué)社引得編纂處的成立。引得,或稱索引,源自英文“index”。在《引得說》中,洪業(yè)特地提到了《史姓韻編》在“減少學(xué)者檢書勞苦”方面之作用。科學(xué)的引得編纂除了具備定位檢索功能以外,還有助于知識的整合與擴(kuò)展。通過引得,可以整理、比較某個特定關(guān)鍵詞或人物在一份文獻(xiàn)中的發(fā)展態(tài)勢,并將其與其他文獻(xiàn)的相關(guān)資料結(jié)合,從而實現(xiàn)新的問題意識與思維開拓。
根據(jù)學(xué)者統(tǒng)計,自1930年成立至1951年,引得編纂處通過西方現(xiàn)代索引技術(shù)整理中國典籍,編出引得64種,共81冊,內(nèi)容遍及經(jīng)史子集,被稱為“漢學(xué)引得叢刊”。在法律典籍的引得方面,尤其需要指出的是1964年莊為斯的《唐律疏議引得》,作為一本代表性的工具書,其為幫助學(xué)者快速檢索關(guān)鍵詞和定位相關(guān)條目,全面揭示唐律的術(shù)語含義和邏輯體系提供了極大便利,對唐律的縱深研究有重要價值。
從《史姓韻編》到近代引得,可見不同時代學(xué)者在文獻(xiàn)化“死”為“活”上所作的努力,但與已完成索引工作的古籍文獻(xiàn)相比,未完成的古籍文獻(xiàn)占比更大。同時,瑣碎的索引工作成本巨大。
更重要的是,紙質(zhì)索引還存在著更新困難、信息孤立等弊端。隨著計算機(jī)與互聯(lián)網(wǎng)的普及,古籍?dāng)?shù)字化工程逐步推進(jìn),保存、檢索古籍突破了地域和物理條件的限制。
近年來,隨著人工智能技術(shù)的發(fā)展,古籍整理逐步從“數(shù)字化”向“數(shù)智化”轉(zhuǎn)型,不再停留在將古籍掃描為影像或轉(zhuǎn)化為可識別文本的層次,而是更進(jìn)一步,通過技術(shù)手段對其中的時間、地點、人物、制度等要素進(jìn)行科學(xué)化標(biāo)注,建立知識圖譜,繪制人物關(guān)系網(wǎng)與事件脈絡(luò)圖,實現(xiàn)跨文本、跨語境的自動關(guān)聯(lián)與動態(tài)分析。與普通古籍相比,傳統(tǒng)法律典籍與各類案牘等法律史史料中包含大量傳統(tǒng)法律實體,例如,傳統(tǒng)罪名、刑罰、審判程序、審判依據(jù)等。因而,法律史數(shù)據(jù)庫的建設(shè)需要在通用型古籍?dāng)?shù)字化工程的基礎(chǔ)上針對法律史研究的特點進(jìn)行領(lǐng)域訓(xùn)練。
從當(dāng)下的技術(shù)條件來看,光學(xué)字符識別(OCR)、自然語言處理(NLP)、關(guān)系抽取等技術(shù)提供了文本提取、實體識別、處理同名異指、異名同指的復(fù)雜情況等功能。更甚,深度學(xué)習(xí)等技術(shù)能夠完成對古代判詞的邏輯、情感的深層識別與分析,幫助揭示傳統(tǒng)司法中情理法平衡智慧。
可惜的是,盡管當(dāng)下已有歷代石刻、地方方志等專門數(shù)據(jù)庫,但以大規(guī)模、系統(tǒng)化、高標(biāo)準(zhǔn)標(biāo)注的司法檔案、案牘等為核心內(nèi)容的法律史數(shù)據(jù)庫稀缺,遠(yuǎn)不能滿足研究需求。法律史學(xué)科的特殊性決定了標(biāo)注、分類、編碼體系必須納入法律史專業(yè),以人工智能與法律史的復(fù)合視野推動數(shù)據(jù)庫建設(shè)。
方法新維:AI量化下的法律史研究轉(zhuǎn)型
在學(xué)科層面,人工智能技術(shù)支撐下開展的法律史數(shù)智數(shù)據(jù)庫夯實了研究基礎(chǔ);在方法論層面,人工智能與量化方法的結(jié)合則或可作為法律史研究范式轉(zhuǎn)型的新契機(jī)。
馬小紅等學(xué)者指出,在法律史研究中,作為基礎(chǔ)的研究方法是考據(jù)學(xué)和史料學(xué)的方法,尋求還原歷史事實,搜集、整理史料并鑒別史料的價值與真?zhèn)巍T谥形鳌⒍鄬W(xué)科交融的背景下,多學(xué)科、比較研究的方法也被引入法律史研究中,拓寬了法律史研究的研究路徑。我們可以看到,例如,瞿同祖在研究中結(jié)合了法律史與社會學(xué)研究方法,討論法律與社會的關(guān)系,但社會學(xué)研究中經(jīng)常使用的量化方法在中國法律史學(xué)界的運(yùn)用仍屬起步階段。
傳統(tǒng)法律史的研究范圍更為關(guān)注國家層面,側(cè)重制度史與思想史研究,近二十年來以黃宗智等人為代表的“新法律史”研究雖然轉(zhuǎn)向?qū)Φ胤皆V訟檔案并進(jìn)行一定規(guī)模使用,關(guān)注法律的實際運(yùn)作形態(tài),但也由于檔案存在的地域性局限等原因?qū)е陆Y(jié)論上存在很大爭議。
而量化方法能夠挖掘制度之間的相互關(guān)系及運(yùn)行實態(tài),識別不同制度之間的因果關(guān)系,在一定程度上彌合法律史研究整體性與個案性、相關(guān)性與因果性之間的張力,推動詳細(xì)系統(tǒng)閱讀文本的“近讀”與注重宏觀揭示規(guī)律和因果關(guān)系的“遠(yuǎn)讀”相結(jié)合,從而擴(kuò)展法律史研究的可能性。
法律史學(xué)的方法訓(xùn)練仍以傳統(tǒng)方法為主,且量化方法存在技術(shù)壁壘,因而法律史學(xué)界在專業(yè)研究中使用量化方法的作品仍屬少數(shù)。目前,在中國用量化方法研究法律史的大多是經(jīng)濟(jì)史出身的學(xué)者。由于使用量化方法需要將數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,在過去的計算機(jī)時代仍需要耗費(fèi)極大的人力物力。如在對比中西方的不同訴訟檔案時,可以用定量方法劃分制度屬性、進(jìn)行標(biāo)準(zhǔn)化賦值,進(jìn)行多維比較,提高制度的可比性和說服力。但不同的語言、檔案格式、敘事風(fēng)格等多方面差異,要求研究者需要通過翻譯和人工數(shù)據(jù)標(biāo)注等工作進(jìn)行數(shù)據(jù)處理,投入大量時間。
人工智能的引入在一定程度上破解了上述困境,通過自動翻譯和自然語言處理,提升量化效率,研究者能夠在發(fā)現(xiàn)跨文化材料之間的多重聯(lián)系。此外,人工智能在量化中的引入還有助于突破主觀的局限性,挖掘更多的研究主題。當(dāng)前有學(xué)者基于監(jiān)督機(jī)器學(xué)習(xí)的自然語言處理方法對《清實錄》進(jìn)行了數(shù)據(jù)處理,發(fā)現(xiàn)在量化處理數(shù)據(jù)的過程中引入人工智能,不僅大幅提高了量化數(shù)據(jù)的覆蓋范圍,而且避免了人工處理的主觀性、前見性,以結(jié)合預(yù)訓(xùn)練和監(jiān)督學(xué)習(xí)的方式實現(xiàn)高精度、無偏差的量化。
陳鈺琪等學(xué)者的研究團(tuán)隊利用Transformer嵌入模型在歷史文本中進(jìn)行心理測量,并建構(gòu)了中國歷史心理學(xué)語料庫,嘗試以模型模擬古人作問卷測試,展現(xiàn)心理反應(yīng)。此類模型未嘗不可用于法律史研究中,例如,通過嵌入模型分析《刑題科本》或地方司法檔案,提取出法律條文適用與裁判邏輯背后的心理傾向,實現(xiàn)對影響裁判者作出判決的情感因素更為科學(xué)的考量。同時,也可將模型運(yùn)用至古代與當(dāng)代的訴訟文書對比中,探討不同歷史時期司法工作者的司法情感取向和審判依據(jù)的變化趨勢。
古今之間一線牽,在法律歷史中尋找規(guī)律、理解當(dāng)下,是法律史研究的核心追求。人工智能技術(shù)的賦能恰為這條貫通古今的脈絡(luò)注入了新的生命力。它不僅能夠推動法律史數(shù)據(jù)庫的數(shù)智化,高效處理浩繁的法律史料,提高法律史知識的可獲得性,更助力法律史研究方法更為多元,拓展“遠(yuǎn)讀”視角,深化我們對傳統(tǒng)法律與治理邏輯的理解。
需要強(qiáng)調(diào)的是,人工智能雖然提供了觀察與研究法律史的新視角,但只是作為一種工具助力法律史的研究更為深入與創(chuàng)新,傳統(tǒng)法律史研究的文本細(xì)讀考究、史料互證方法與歷史人文關(guān)懷仍然具有價值,而學(xué)者的人格風(fēng)骨更不是技術(shù)工具可以取代的。展望未來,通過數(shù)智化的手段將中華優(yōu)秀的法律傳統(tǒng)納入全球比較法研究的框架,是新時代法律史學(xué)者的歷史使命,也是提升文化軟實力、實現(xiàn)中華法系復(fù)興的重要選擇。
(作者分別為清華大學(xué)法學(xué)院教授、清華大學(xué)法學(xué)院碩士生)

微博
微信

京公網(wǎng)安備 11010502038778號