- 降噪 | denoise
- Posts
- EP23 - 當 AI 遇到法律科技
EP23 - 當 AI 遇到法律科技
為大眾而生的法律 AI Agent:Lawsnote QA
歡迎來到降噪,一起消除雜訊洞察價值
SHAREING
當 AI 遇到法律科技

被限制出境還能去金門嗎?

不知道你是否跟我一樣,在看法庭劇的時候
最期待的就是主角在關鍵時刻
對方的辯護律師還在資料堆裡焦頭爛額的時候
一字不漏地背出所有法條的內容,當庭擊潰對手
帥爛!
現在,你不需要背下所有的法條
拿起手機就能隨手查閱法條以及判決書
甚至解答你的法律問題,省下大筆律師諮詢費用
今天要解析的是素有台灣法律 Google 之稱的 Lawsnote
法律界的 Google
Lawsnote 成立於 2016 年,致力於成為律師們的好幫手
業務的核心就是建立法學與判決書的搜尋引擎
獨家的搜尋技術與排序功能
讓律師與企業能在最短時間找到相關的裁判
在台灣,超過七成的律師使用他們的法學搜學引擎
大型語言模型的挑戰
跟 co-Founder Barry 同為 AppWorks#13 的校友
因此不時的會在臉書上關注他的近況
印象很深,在 OpenAI 發佈 Chat-gpt4 Turbo 的時候
Barry 在臉書轉發了發表會的新聞
並留下了 "都給你玩給你玩" 等字句
當時海內外媒體正在火熱討論的是
Chat-gpt 是否會取代 Google 的搜尋引擎業務
這個問題對同樣做尋引擎的 Lawsnote 來說一樣沉重
如果 Chat-gpt 真的能回答所有問題
搜尋引擎是否還有存在的必要?
為了回答這個問題 Lawsnote 選擇直面挑戰
因為他們發現 LLM 產生的 ''幻覺'' 在法律上是無法接受的
2023 年美國與加拿大就發生律師使用 Chat-gpt 生成的判例而招致糾舉的狀況
這讓他們爭取到空間來解決這個棘手的問題
對抗幻覺
最初他們嘗試的是用目前業界最主流的作法 "RAG" ( 檢索增強生成 )
也就是將大量的法律文本與判例透過 Embedding 的方式存入向量資料庫
再透過 LLM 訪問這個向量資料庫來生成結果
但這個方法有兩個致命的缺點:
第一個就是 成本過高
34 萬部法規以及 2000 多萬筆判決
以及光法條就高達一兆 Tokens 的 Embedding 費用
( 進行一次算力成本約在2-3000萬元 )
不是一般公司能負擔的
第二個就是 輸出效果很差
使用者傾向使用自然語言來做提問
但是法條與判決書中的文字卻是使用法律用語
這使得兩者在向量資料庫中產生了不匹配的情形
例如
我們一般會問詢問「房客不付租金該怎麼辦?」
但實際的法律用語卻是「承租人」、「給付遲延」
這些文字誤差導致在向量環境的檢索效果不彰
過程中他們也嘗試使用 Hypothetical Document Embeddings (HyDE) 的方式來解題
也就是先用 LLM 把問題轉化一次,利用使用者輸入的問句來生成不同的問句
比對這些問句,最後再將相關性高的問句輸入向量資料庫來生成回答
但結果還是差強人意,生成的問句還是容易偏離
無法解決自然語言與向量資料庫不匹配的情形
搜尋引擎 + LLM
最後
他們從搜尋引擎留下來的使用者數據發現了寶藏
在 Lawsnote 開通搜尋服務的八年間
累積了龐大的搜尋結果 ( 法條或判決 )
每筆搜尋事實上就是在替檢索的判決建立關聯性
也就是說每個判決在被搜尋取用後都會被打上一個標籤
這個標籤可以映射回使用者所輸入的文字或概念
目前這些標籤已經累計一百多萬筆
幾乎涵蓋一般使用者使用自然語言提問的字句
除此之外,他們還將判決文本與標籤做了知識圖譜 ( Knowledge Graph)
打造了搜尋引擎與大型語言模型協同合作的方法
而這個成果也催生了他們最新的產品 Lawsnote QA
Perplexity 法律版
我們都知道 LLM 的強項就是聽得懂自然語言
Lawsnote 整合了 LLM 與自家的搜尋引擎技術
推出了聽得懂人話也說人話的 Lawsnote QA
你說,這輩子清清白白
這東西聽起來很酷但法律判決與我何干?
剛好前陣子朋友因為樓上鄰居漏水而花了一筆錢
我隨手問了 Lawsnote QA
「樓上漏水造成我家損失該怎麼辦?」
Lawsnote QA:公寓大廈管理條例 第36條、民法 第213條;臺灣士林地方法院 106,湖簡,1266 民事 判決
又想到
「投資比特幣需要繳稅嗎?」
「摩托車改管很吵該怎麼檢舉?」
最後我整個問上癮
「打呼很大聲會有被離婚的風險嗎?」( 真的有判決成立= =)

我發現,並不是法律判決與我何干?
而是我們心中很多法律問題從來沒有被解答過
因為我們不知向誰求問,也無從問起
你也有很多問題想問嗎?
不管你是想告人、怕被告、問法條、查刑期 ( 誤爛
Barry 說 Lawsnote QA 完全免費使用
Reply