休夫娘子人工智能辅助立法是有待深入研究的法学领域。从理论基础来看,人工智能在法律知识图谱构建、逻辑推理框架设计和信息量化抽取处理等方面可以发挥辅助立法的作用。从现实需求来看,科学立法、精细立法和协调立法目标的实现都离不开人工智能的辅助。囿于人工智能技术的发展水平和法律人工智能的研究现状,人工智能在辅助立法的过程中也潜藏着若干问题。为了扬长避短,使人工智能立法与人类立法优势互补,我们应当完善法律知识工程的建设,进行特定类型立法的人工智能辅助尝试,并加强对人工智能辅助完成立法的人工审查。
近年来,新一代人工智能技术的发展和应用全面而深刻地影响着人类社会发展的各个领域,法治实践领域也不例外。但是,目前国内理论和实务界更多关注人工智能创造物的性质和权利归属、人工智能的法律主体地位以及人工智能的侵权风险等以人工智能为调整或规制对象的法律问题,对人工智能作为完善法治工具的探讨略显不足,相关研究主要集中在智能司法方面,对人工智能辅助立法的研究尤为欠缺。在有限的研究文献中,有学者认为,人工智能的强大信息处理能力可以有效弥补传统立法的决策缺陷;[1]有学者从宏观上分析了人工智能在立法各阶段的应用与展望;[2]有学者在指出人工智能辅助立法具有积极意义的同时强调要对其加以规范和限制;[3]另外有学者揭示了目前我国人工智能辅助立法处于较为初级阶段的事实,思考了人工智能辅助立法的困境,并提出了体制机制上的解决方案。[4]现有研究大多着眼立法流程中的具体需求,在直观认知上具有明确的对应性和指引性,但是对人工智能辅助立法何以可能和必要,其内在运行的机理如何,应当怎样更好地发挥其功能,还缺乏足够系统和有深度的分析。本文将从人工智能辅助立法的理论基础出发,结合当下我国人工智能辅助立法的现实需求,分析人工智能辅助立法的潜在问题,提出人工智能辅助立法的渐进方案。
人工智能与法学理论研究的线年代,早期的研究集中关注建立基于规则和案例的法律推理模型或专家系统,也即人工智能司法领域。随着人工智能科学和技术的不断发展变化,以及人工智能专家和法学专家的深度合作,人工智能与法律的研究领域不断扩大,其中人工智能立法问题的研究约占据12%。[5]以往的研究、相关的实践和技术的发展表明,人工智能主要可以在法律知识图谱构建、逻辑推理框架设计和量化信息抽取处理等方面发挥立法辅助作用。
知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关“属性-值”对。不同实体之间通过关系相互联结,构成网状的知识结构。在知识图谱中,每个节点表示现实世界的“实体”,每条边为实体与实体之间的“关系”。通俗地讲,知识图谱就是将所有不同种类的信息连接在一起而得到的一个关系网络,提供了从“关系”的角度去分析问题的能力。[6]众所周知,任何一部立法调整和规范的都是特定领域或者某种类型的社会关系,因而用知识图谱来表示主体、客体、法律事实等相关“实体”以及实体之间的关系等具有较强的契合性。
在立法活动中,人工智能对法律知识图谱的构建大体可以分为两类。第一类是法律修正中的知识图谱构建。此类法律知识图谱构建与司法实践过程中的知识图谱构建较为相似,即都以既有的法律文本、大量的案例素材和要件事实的解构为基础,以对应于人工神经网络的深度学习、分词的设置以及以语义表示为核心的知识建模。[7]第二类是法律创制中的知识图谱构建。由于不存在现成的文本,此类法律知识图谱中的“实体”需要从上位、邻近、相关立法以及现实世界的有关综合信息中选择并加以确定。人工智能发展中以“本体论”为基础的法律知识工程建模技术可以较好地应用于上述立法中的“实体”创制过程,①从而生成可靠、高效以及有良好基础的法律知识系统,并实现理论性与实用性之间的平衡。[8]基于“本体论”的法律知识图谱构建具有概念清晰、语义丰富、层次明确、独立于模型以及可以共享等特点,比规则主导型和案例主导型的法律知识图谱构建更适合应用于法律创制活动,并且更具普遍意义。[9]
人工智能辅助构建立法知识图谱的过程也是一个应用各种模式匹配、概念图匹配和混合式传播激活等技术形成语义网络的自然语言处理过程。[10]针对创制性立法不具有现存法律文本而需要处理更多生活化自然语言的特点,国外有学者专门开发了辅助立法的智能XML工作流模型,能够生成高质量、用户导向以及相互连接的开放数据,从而全面涵盖开放立法的快速发展领域。[11]
人工智能辅助立法中的语义网络和知识图谱构建,不只是为了生成形式上完整的法律文本,而且追求该文本内在结构也即实体之间“关系”的逻辑自洽和圆满。惟其如此,该法律在其后的适用和实施过程中才会相对顺畅而较少出现问题。人工智能恰好比较擅长有关逻辑推理的应用,所以也能够在辅助立法的过程中发挥此方面的重要功能。
早在1957年,耶鲁大学法学院的莱曼·艾伦(Layman E. Allen)教授就发表了《符号逻辑:起草和解释法律文件的锐利工具》一文,指出符号逻辑是可以消除立法中某些容易疏忽的模糊性,让起草者获得更为清晰、准确和高效结果的新技术,并能够为法律起草、解释更加综合化和系统化提供有价值的协助。该文具体分析了6个基本的逻辑关系在法律起草和解释中的应用:蕴涵、连词、共隐、排他性析取、包含性析取和否定。[12]
从单行法律内部的通用简化模式来看,人工智能辅助立法中的逻辑推理应用体现在语义网络中概念实体的分类和联系方式。具体过程是:“建立相关法律概念的位阶体系,根据问题域所对应的属性值在位阶体系进行概念推演,从而形成一个解的决策过程。实体联系和泛化联系属于概念位阶体系中的纵向联系,聚集联系属于概念位阶体系中的横向联系,而属性联系则是进行推理的条件入口和退出推理并返回结论的出口。”[13]
从立法的系统性和动态性来看,人工智能可以辅助进行的逻辑设计和推理显然并不局限于某部立法本身。人工智能可以“对法律规范的渊源以及它们的等级秩序进行分类,即寻找各种法律中的不一致”,以及“对判例法进行分类,并从受法外因素影响之裁判背后的推理中提取要素”。[14]在逻辑框架的设计和应用方面,人工智能不仅可以辅助进行前置性的准备工作,而且可以保持对法律的追踪,加强立法后的评估工作,从而更好地推动未来的法律修正。例如,上世纪80年代,伦敦大学帝国学院的某逻辑编程项目工作组对1981年英国《国籍法》进行了立法评估性建模,旨在测试基于规则的逻辑推理模型对于大型复杂法规的可适用性。这一建模过程发现了该项立法的若干问题,例如未定义的法律谓词和漏洞,否定的形式化,违反义务和反事实的使用,常识的表示以及法规中的行政自由裁量权应用等。[15]
立法活动中的概念化知识图谱和形式化逻辑框架构建都是以大量信息的收集、分析、处理和转换为基础的,而人工智能尤其是硬件性能和算法能力得到大幅提升后的新一代人工智能技术,在机器学习以获得最优解上相较于人类主体具有明显的优势,所以能够在这方面发挥较好的辅助作用。
无论是法律修正还是法律创制活动,首先都需要对现行法律体系之下的相同概念和相关制度进行统一的梳理、比较和分析,以避免新的立法与正在实施中的有效法律之间的潜在冲突。人工智能中的聚类算法最擅长处理此类问题。“一个集群相当于一组相似的实体,或者以最低限度来说,一组相似的实体之间的相似度比和其他集群中的组成部分的相似度要大。……一旦我们掌握了集群组,就可以将其看作物体,然后反过来对其进行聚类,以此类推,直到对所有东西都进行聚类。”[16]聚类算法同样可以应用于立法过程中的案例裁判总结、域外经验借鉴和社会意见征求等信息的抽取和处理。以聚类算法为中心,新西兰有学者开发设计了用以构建动态立法网络的信息抽取流程,从而使相关立法能够跟上社会演进的步伐。[17]
基于其强大的计算能力,人工智能对修正或起草赔偿、罚款、罚金、期间、期限等与数字直接相关的法律规范具有显著的辅助作用。[18]这种辅助作用在采用计算机模拟法律应用场景以全面观察相关实体的结构和行为时,能够得到最大程度的发挥。智能模拟比单纯的文本分析和数学计算更能够有效兼顾法律所调整社会现象的复杂性和紧急性,从而验证立法者预设的相关量化标准是否适当,是否需要重构。[19]德国就已经将这种智能模拟、动态学习的信息处理模式落实为一种新的立法类型——实验法。[20]
即便是与数字和计算没有直接关系的法律规范,人工智能也能够起到重要的辅助起草作用。因为从某种意义上讲,“法律可以被理解为用于规定法定条件与法律后果之间映射关系的函数。理想的最优解法律,是能够有效反映系争行为及其法律后果之间映射关系的函数。这个函数既不会过度简单(欠拟合),也不包含不必要的复杂度(过拟合)”。[21]朝着这个目标,立法者可以应用包含相关算法的人工智能来起草法律规范,并借助前述智能模拟场景来验证其是否可以达成最优解,诸如实现权利、义务、责任、安全、效率、经济效益与社会福利等之间的综合平衡。
从我国的现实情况来看,2011年十一届全国人民代表大会(以下简称全国人大)四次会议宣布中国特色社会主义法律体系已经形成。此后我国立法已进入到更加科学化、精细化和协同化的阶段,立法在多个方面都需要人工智能的辅助。
《中共中央关于全面推进依法治国若干重大问题的决定》指出,科学立法的核心在于尊重和体现客观规律。从这个意义上讲,科学立法就是指运用科学理念、方法、标准去探求和发现法律所调整社会关系的客观运行规律,并将其形成规范体系的活动。整体而言,科学立法包括立法决策的科学性、立法过程的科学性以及立法结果的科学性。立法结果的科学性也即立法内容的科学性,其判断标准主要包括立法的合规律性、合体系性以及合目的性。[22]
立法决策的科学性要求立法应当符合国情或者地方的实际情况,有利于国家整体发展战略的实施和政策举措的推行,适应多层次、多方面的社会需求,并符合宪法、立法法关于立法体制的规定。[23]这就需要立法机关充分利用爬虫软件、智能检索软件、文本挖掘技术和智能信息征集平台等工具收集、抽取、分析和处理各类相关结构性和非结构性数据,建立国家之间或地方之间类似立法的比较模型,对现实的社会因素进行机器可读、逻辑严密、价值可估的法律“实体”转化,并对立法实施后的效果进行预测模拟,以考量和判断某项立法的必要性以及宏观上的理念导向、基本原则和框架体系。
立法的合规律性涉及的规律包括社会事件的因果律、特殊社会的具体规律、社会发展的基本规律、人类活动所涉及的自然规律等。[24]在这方面,立法机关同样需要寻求人工智能的协助。首先,对于某项立法所涉及社会事件的信息汇总,由人工智能从新闻报道、文献记录和其他相关材料中去检索挖掘显然比人工完成更具有可行性、快捷性和全面性。第二,以海量数据统计和概率计算为基础的人工神经网络对立法所调整社会关系之“规律”的探寻,比有限人类个体的认知更加客观、中立和准确。第三,人工智能中的遗传算法和强化学习不仅有助于发现与立法相关的自然世界的进化规律,而且有助于总结人与自然交互乃至纯粹社会活动过程中的最佳行动方案。最后,对于新兴科学技术领域的相关立法而言,人工智能对科学概念、理论、观点、争议的代码化、公式化和模型化,有利于立法者更加清楚地认识立法的重点和应当选择的路径。
立法的合体系性与合目的性事实上也是另外一种合规律性,是指立法的内容应当符合法律科学的内在构成规律和制度调整目的。就合体系性而言,人工智能在处理此种规范性文本和结构性数据中的优势更加明显,可以比较快速地发现立法的章节体例和具体条款在形式逻辑上可能存在的矛盾冲突之处,并给出相应的修改建议。就合目的性来说,人工智能同样能够轻松地发现某些法律条款不能实现立法宗旨甚至与立法宗旨相悖,以及不同的立法条款在实现立法宗旨的方式上可能并不统一,从而帮助立法者进行相应的调整。
精细立法是与粗放立法相对而言的,指应当进行更具有针对性、实用性和可操作性的精确、细致立法。精细立法的标准大体包括立法领域的细分性、立法技术的精湛性和立法内容的准确性等几个方面。
立法领域的细分性是指面对当下社会分工日益扩大、社会交往日趋复杂的现实情况,无论是国家层面还是地方层面的立法,都需要突破理论认知和宏观实践上的法律部门、法律领域划分,而要以更加具体现实且有广泛牵涉性的问题为导向,制定能够有效解决问题、实现社会利益平衡的法律。在这方面,以维基百科为基础的开源知识图谱作为覆盖面较广的人工智能语料库,可以有效协助立法机关打破专业知识领域的禁锢和限制,而又不影响立法相关之垂直法律知识图谱的成功构建。[25]人工智能在立法领域细分上的另一方面辅助作用在于,其可以对作为细化立法依据的上位法规范在逻辑上做进一步的解析,提炼出更加细小的“实体”以及相关“属性-值”,并使之与实践中出现的新问题相对应。
立法技术的精湛性是指能够选择和使用最为适当的立法技术,将法学理论研究的科学成果和实践过程中的立法需要较好地转化为规范性法律文件的内容,实现法的理论、法的规范和法的实践的统一。[26]全国人工委在《关于〈立法技术规范(试行)(一)〉的说明》中指出:“立法技术规范包括法律的结构、形式、文体、修改和废止的方法等方面的规则,是起草、修改法律需要掌握的具体操作标准。”对于此类严格遵循特定命名规则、逻辑关系和对应形式的技术规范,人工智能可以进行最为准确的匹配和应用,几乎不会像人类法律起草者那样可能发生疏漏、矛盾或错误,因而更有利于提高立法的效率和保障立法的质量。
立法内容的准确性是指立法应当尽量减少政策性、宣示性条款,增强法律原则与具体规范之间的联系,并且具体规范所规定的主体、客体、权利、义务、权力、要件和结果等应当清楚明确,使所完成的立法更具可操作性和可执行性。为了更好地实现立法的准确性,一方面,人工智能中的文本挖掘和自然语言处理等技术可以将相关政策中的内容转换为具有规范结构和适用条件的法律条文,避免法律的空泛性;另一方面,通过对现实社会中相关数据的机器学习,人工智能可以更为准确地界定法律中的“实体”及其相互之间的“关系”,减少法律的模糊性,例如明确“有关部门”具体是指哪些部门,行政管理和执法应遵循何种程序,行为模式与法律责任之间如何对应等等。[27]
协同立法是指具有立法权的不同部门或不同地区之间就特定问题进行协作共同立法。广义的协同立法既包括部门或地区联合制定一部法律,也包括部门或地区分别制定具有类似性或相关性、且彼此协调或衔接的法律,狭义的协同立法主要是指前者。在国家治理体系和治理能力现代化的建设过程中,协同立法是不可或缺的组成部分,具有重要的内在耦合功能。
当下我国从法律、行政法规到部门规章往往都是由某一主管部门或最为直接相关的部门来撰写和提出法律草案的初稿,这造成立法有意或无意地带有浓厚的部门利益倾向。部门之间的协同立法则可以在一定程度上淡化和消解这一问题。人工智能在部门协同立法中主要可以起到两方面的辅助作用:一是各部门实质性结构功能的划分与法律对应,二是立法过程中群组工作的技术支持。结构功能主义认为,任何一个整体系统都存在一定的结构体系,而结构又决定或影响着该系统功能的发挥。部门协同立法就是帮助中央政府实现国家层面的经济调节、市场监管、社会管理和公共服务等功能的独立系统。[28]人工智能可以通过两种方式来确定参与协同立法的各部门的结构功能划分:第一是根据现有立法对各部门的职权设定进行全方位的语义分析和制度匹配,第二是对立法所要解决的各具体问题所涉及的信息进行“认知的计算化”,使对应的管辖权设置、利益调整机制和法律后果形式等达到最优。[29]协同立法过程中的群组工作支持是指将人机交互过程中的“群件技术”应用于不同部门之间的工作流程,具体包括群件系统的体系结构、信息共享方式、决策支持工具、应用程序共享及同步实现方法等。[30]
与部门协同立法早有联合出台规章的实践不同,我国的地区协同立法显然仍处于摸索阶段,因而存在着更多需要谨慎思考的问题。例如,协同立法的“地区”,包括跨省市的区域、省级行政区划内的区域、省级行政区域与特别行政区一体化的区域等如何确定;地区协同立法的权力如何行使,遵循何种程序和方式;地区之间可以就哪些事项进行协同立法;地区协同立法的效力如何,应当如何实施等。[31]人工智能对于理清地区协同立法中的上述问题具有较强的辅助作用。首先,通过对宪法、立法法、法律、全国人大和省级人民代表大会的经济社会发展规划以及党中央的文件等进行智能检索和梳理,能够确定可以进行协同立法的地区名称、范围和权限。第二,除了一般性的群件技术外,通过对京津冀、长三角、珠三角等地区协同立法既有数据的机器学习,人工智能可以将优化的立法程序、措施算法化和类型化。第三,人工智能有助于全面而深入地挖掘真正需要跨地区协作执行的法律事项,在立法中构建明确的可操作机制,避免地区协同立法流于形式。
虽然人工智能辅助立法有其充分的理论基础和迫切的现实需求,但我们也应当清醒地认识到,人工智能技术的发展还有很大的改进空间,在很多方面与人类智能相比还存在着不足,而法律又是以调整人的行为和关系为中心的复杂文本,因此,人工智能在辅助立法的过程中必然会存在诸多潜在的问题。
人工智能辅助立法的首要困境是有关法律知识表示的。无论某部立法调整何种具体领域和社会关系,其都存在着一些在非法律话语体系下也具有不变内涵和以相同方式表示的通用概念,例如事件、时间、物理对象和信念等。这些通用的、基础的、上位的“本体论”概念对知识表示非常重要,因为其决定了对其下位的具体化、特殊化概念进行描述和表示的可能,从而也就使某种程度和范围的知识图谱得以成功构建。迄今为止,世界范围内的通用本体论工程都只取得了非常有限的成功。[32]而这些相对成熟的通用语义网,如词网(wordnet),又都是以英语作为自然语言处理的对象而构建的。中文语义网的探索与研究虽然也在语料库、依存句法网络等方面取得了一定的进展,但目前还缺乏认可度和接受度较高的语义网。[33]法律术语与日常用语在某些情形下的内涵和指称差异则进一步增加了相关知识表示的难度。
即便是从法律领域的专用本体论工程角度来看,人工智能辅助立法中的知识表示和知识图谱构建也存在不小的困难。第一,我国在自然语言形态上尚且缺乏权威的、保持动态更新的法律词典,就更难以期待人工智能在不同立法中所构建的知识图谱在“实体”及其“属性-值”上具有高度一致性。第二,传统的基于规则和基于案例的法律专家系统,都是以法律适用中的“问题求解”为目标的知识框架,[34]对相关法律知识体系的修正或重构难有直接帮助,甚至这些法律和案例的数据库本身都存在各种各样的缺失和错乱。第三,在立法需求较多的网络治理和相关领域,法律知识表示如何融合多源信息,尤其是互联网文本中的开放数据,在整个人工智能技术开发领域都还处于起步的阶段。[35]第四,立法所调整的现实世界的主体、客体、行为和关系的复杂性以及法律概念外延本身的不确定性决定了,只有通过设计和开发多智能体的方法才可能在一定程度上解决相关知识表示的问题,而这种工作向来并不容易。[36]第五,人工智能辅助立法中的知识表示工作乃至知识图谱构建,需要法律专家与计算机专家的深度交流和专业融合,最好是有“法律+算法”的复合人才和工作团队,而这方面实践显然还欠缺。
人工智能辅助立法中的逻辑推理设计缺陷与其知识表示问题密切相关。传统上,符号主义人工智能通过应用“如果-那么”(If-Then)的基础逻辑来处理和表示法律概念,并建构起整个制度体系,虽然在形式上与法律推理的“三段论”高度契合,并且在结果上能够很好地生成立法所追求的法律文本,但由于人工智能并不真正理解相关法律概念所对应的现实世界事物,所以该法律文本在适用过程中的具体指称和实质解释就存在很大的问题。塞尔在“中文屋”思想实验中所提出的关于符号主义人工智能缺乏生成理解力或意向性之“恰当因果能力”的一般质疑,在人工智能辅助立法领域仍然未能得到解决。
基于符号主义和形式逻辑的人工智能在辅助立法的过程中可能会存在以下一些具体的缺陷。第一,当法律体系较为庞大时,新旧规则会导致编程中的潜在逻辑冲突难以被发现。第二,由于缺乏人类的直觉、经验和常识,人工智能在立法过程中对事实进行编码的框架可能发生莫名其妙的错误,尤其是无法涵盖和表示那些存在“缺省赋值”的例外情形。第三,消解定理证明的应用可能会导致人工智能设计的相关法律条款在适用过程中被不当地进行“反对解释”,产生错误的结论。因为在现实生活中,证明某事为假,和不能证明它是真并非一回事。第四,人工智能立法依据“单调推理”逻辑确认为真的基本原则和规则有些并非永远为真,而这一问题即便是引入“非单调推理”逻辑和“模糊”逻辑也不能完全得到解决。[37]最后,尽管“道义逻辑”在法律规范设计和法律推理中的应用已经取得了较大进展,[38]但人工智能距离将人类伦理价值取向代码化并体现到立法中还非常遥远。
神经网络和机器学习的发展对人工智能辅助立法中的上述逻辑缺陷同样无能为力。作为一种将重点从逻辑转向概率和信念程度的联结主义人工智能,概率会遇到与逻辑相同的难题:“会出现可能为真却无关的结论,会有可能为真却难寻的结论,会有无对立信息才可得出的结论,更会有一些与得出结论无关的方法。”[39]具体到人工智能辅助立法领域而言,深度学习可以通过对大数据的分析得出关于某一类行为及其结果在统计上概率最高的联系,并以此来确定调整相关主体之间关系的法律规范,但是概率最高并不等于真实的因果关系,据此确定的规则就有可能违反正义公平价值。[40]
人工智能辅助立法在信息的抽取、计算、分析和处理方面也存在若干隐患。第一,人工智能在数据处理方面的一般问题也会显现于辅助立法领域。具体而言,为了创制面向未来的法律规范体系,人工智能需要收集与立法所调整社会关系密切相关的信息,在此过程中,可能会面临数据匮乏或数据过剩、以及数据漂移等问题。数据匮乏是指由于隐私、安全保护或者技术、收集渠道等方面的原因,人工智能不能获得为辅助立法所需要的足够数据量,以至于强大的算力优势无从发挥。数据过剩是指由于算法设计等的偏差,人工智能收集了过多的与立法无关或者不能满足标注和训练需要的数据。数据漂移则是指由于所调整对象的动态变化性,为立法而收集的历史数据与法律实施后的未来实际数据存在显著差异,导致依据人工智能计算结果而进行的立法设计无法适应现实生活。[41]
第二,人工智能展开的信息计算主要适合进行的是法学定量研究,但是立法却是要制定具有普遍适用效力的规则体系,其中包含对大量一般性、抽象性问题的界定,需要进行相当多的定性研究。在人工智能辅助立法的过程中,如果过于追求数据化驱动带来的便利,突破法律所调整社会关系在数理上的模糊性而进行不当的数据化加工,完全依赖可计算性或数学建模来制定法律规范,既会造成上述种种逻辑缺陷,也会悖离法律的基本价值取向。[42]
第三,即便是在定量治理色彩十分浓厚的立法领域,由于主体及其行为选择策略的多元性,以及法律之间、法律与其他社会规范之间的牵连性等复杂的因素,人工智能也并非总能够构建一个有利于实现法律调整目标的数据模型,并据此完成良好的制度设计。例如,在经济法和社会法领域的很多新立法,像税收立法,往往以减少和缩小贫富差距为目标,在这方面衡量国民收入差距的“基尼系数”是一个较为直接和实用的指数,但是如果人工智能单纯以基尼系数为准而进行立法的数据计算分析,所得出的制度模式必然不是最佳的问题解决方案,因为贫富差距的缩小和实质正义的实现还与社会保障制度等其他因素密切相关,立法者必须考虑调整对象的综合利益权衡和行为选择空间。[43]
第四,执着于计算结果的人工智能可能潜藏着设计者都未曾意识到的算法歧视,由此而制定的法律规则就无法做到线年,欧盟和美国就注意到大数据算法分析对的歧视和排斥问题。数据的不完美性往往使算法继承了人类决策者的种种偏见。数据挖掘所意外发现的一些规律也有可能是关于排斥和不平等的既有模式。不加深思熟虑就依赖算法、数据挖掘等技术可能排斥参与社会事务。[44]在立法领域,尤其是追求实质正义和社会公平的立法,这样的人工智能算法会造成明显的利益失衡。
尽管人工智能辅助立法存在上述潜在的问题,但其主体面仍然是积极有益的,因此,我们不能因噎废食,彻底放弃此条创新且可行的立法路径尝试。从另一个角度来说,人类立法也有不少无法避免和难以克服的缺点,所以我们需要做的是充分发挥人类思维和智能计算各自的优势,互为补充、相辅相成地推进人工智能辅助立法的实践方案。
“工欲善其事,必先利其器。”人工智能辅助立法要想取得成功,就必须从数据、知识、技术和组织等方面做好充分的准备,提前构建好体系完整、结构合理的法律知识工程。
第一,全国人大和地方各级立法机构应当进一步完善既有立法文本的数据库。此种完善不仅包括数量上的补全,现行有效与否的明确,更为重要的,是使之能够进行多角度的交叉检索和细节性的深度检索,从而保证未来人工智能辅助立法中相同“实体”概念及其关系之逻辑编程的一致性。类似的案例数据库完善工作也要在最高人民法院和地方各级人民法院之间展开,尤其是涉及运用司法上的自由裁量权进行法律漏洞填补的案件,因为这与人工智能辅助立法中创造新的“实体”概念及设定其“属性-值”密切相关。此外,为这些立法和案例数据库提供公共的阅读尤其是评论空间,则可以在更广泛意义上收集未来法律修正或创制所需的数据,在一定程度上减少因人为的思维定势造成的立法偏见。[45]立法所需的统计数据汇集、社会意见征集和其他数据收集也应当形成固定的流程和标准,以方便人工智能进行信息抽取和立法计算。
第二,全国人大可以联合中国法学会组织权威专家学者编纂定期更新的在线法学词典。对于人工智能辅助立法而言,该法学词典应当能够起到专业语料库的作用,从而便于立法机关基于本体进行法律体系的建模。要完成该项建模工作,与法律术语相关的自然语言处理技术的开发和不断升级也不可或缺。在法律领域的专业语料库和语义网建设之外,我国立法机关和相关主管部门还应当鼓励和引导人工智能研发机构与互联网企业共同开发类似于词网的一般性中文语义网,在更全面覆盖立法相关知识表示的同时,也使得人工智能辅助完成的立法成为更契合调整对象行为习惯和特点的规范体系。
第三,各级立法机关应当围绕立法过程的科学化、精细化和协同化要求进行有针对性的人工智能算法设计和机器学习训练。具体的工作主要包括:通过编程将立法程序规范和立法技术规范代码化,从而使立法的伦理价值与专家知识更加一致,使新的立法较好地整合到现有法律代码中,并且使该立法在不影响基本代码的情况下具有适应情境的灵活性。[46]加强与立法中实体概念划分相关的聚类算法和贝叶斯算法研究,并通过深度学习和强化学习尽可能使常识程序化。[47]组织法律专家与计算机技术专家一起对人工智能要学习的数据进行标注,使该监督学习能够更好地保障其后立法中逻辑关系框架建构的合理性。
法律知识工程、中文语义网的建构以及人工智能辅助立法过程中各类算法的设计、机器学习的展开都并非一蹴而就的工作。现阶段想让人工智能去帮助完成体系庞大、内容复杂、调整范围广泛的立法还显得操之过急。因此,我们可以就一些特定类型的立法进行循序渐进的尝试,并随着人工智能技术和法律人工智能研究的进步而不断解决所发现的问题,最终迎来一个普遍的人工智能辅助立法时代。
第一种类型的人工智能辅助立法尝试,是对现行法律法规的非根本性修正和直接实施现行法律法规的下位细则立法。人工智能在此类立法中的应用与在司法中的应用具有很多的共性。就法律知识表示和知识图谱构建而言,其主要的“实体”和“关系”已经体现在现行法律规范中了,人工智能需要做的是对内涵发生显著变化的“实体”及相关的“关系”进行重新编码,并将新增的“实体”代码化和整合到原有的知识体系中。就逻辑框架设计而言,人工智能在此类立法中一般无需增加新的算法和推理模型,而只需要将原有的演绎推理和类比推理等算法应用到新增加的规则当中。[48]就立法所需信息而言,旧法和上位法在实施过程中已经积累了一定的司法案例、执法数据、专家观点、媒体评论、公众意见和其他相关数据,可以作为机器学习和概率统计的素材,也可以作为设计推动法律制度“进化”之遗传算法的依据。
第二种类型的人工智能辅助立法尝试,是所调整社会关系或地域范围等相对集中有限的新立法。立法所调整社会关系的有限性可能体现在客体的专门性上,例如对某类科学技术的研发和应用进行监督管理的立法,制定劳动安全卫生技术规程或其他国家强制性技术标准的立法;也可能体现在主体的特定性上,例如对具有某种特定宗旨的非营利性法人组织的设立、运营和管理等进行规制的立法。在这些立法中,客体的专门性尤其是技术性使得调整它们的法律规范比较容易代码化,并且因其与社会公众的日常生活联系并不密切,可以减少由于人工智能的常识认知缺陷所带来的立法隐患。主体的特定性则使得集体共识或自律规范容易达成,也就便于人工智能进行符号化处理,主体的特定宗旨也使得其行为的作用对象和范围比较有限,如此一来,人工智能也就容易完成实体关系和法律知识图谱的构建。立法所调整地域范围的有限性主要体现为地方立法机关根据《立法法》的授权就城乡建设与管理、环境保护和历史文化保护等方面的某一特定问题所进行的立法。地域范围的有限性本身就降低了社会关系的复杂性,而地区环境和历史文化的独特性则更加便于人工智能对其进行知识表示和立法“计算”。
第三种类型的人工智能辅助立法尝试,是与数学计算存在较为直接密切联系的金融财税等立法。这些领域的立法以各种金钱数额和比例区间等为直接的调整依据,因此,如前所述,在算力上比人类具有明显优势的人工智能可以发挥重要的作用。不仅如此,金融领域也是人工智能应用普及程度较高的四大行业领域之一,[49]这就为该领域法律规则的智能化创制提供了更为便利的条件。
上述类型的立法由于实体数量、关系网络和动态变化等情况都不太复杂,也便于进行智能场景的模拟以评估法律实施的可能效果,或者是对现场实验的数据进行人工智能的计算分析,进而权衡法律文本是否有修改的必要以及应当如何修改。
无论人工智能技术的发展如何进步,其辅助立法的实践如何成熟,法律始终应当是以人为本的,人的主体性、价值性和目的性不可动摇,所以人工智能辅助完成的立法必须接受人类的终极审查才能生效。
人工审查的第一个方面是对人工智能辅助起草的法律文本进行语言上的全面仔细检查和推敲。即便是我们如愿完成了法律语料库和一般中文语义网的初步建设,人工智能在应用自然语言处理技术进行机器可读代码与立法中规范术语的相互转换时也并非总能尽善尽美。因为立法在处理与现有法律规范关系时一般会用到基于规则的自然语言处理技术,而在创设全新的法律规范时则会用到基于统计的自然语言处理技术,两种技术在同一立法过程中的混合应用就可能会造成法律语言的不一致问题。而且在法律术语与日常用语内涵不一致的情况下,基于统计的自然语言处理技术本身就可能会做出错误的选择。此外,语言与内涵之间的多映射关系,同一种语言形式可能有多种意思,例如“合同”既可以指法律行为也可以指法律关系;同一种意思可以由多种语言形式表达,例如“应当”与“必须”“合理”与“正当”等,也可能导致人工智能辅助起草的法律文本产生一定的混乱。这些都是人工审查立法文本应当重点注意的地方。
人工审查的第二个方面是认真梳理人工智能辅助完成的立法中内在逻辑关系较为复杂和现实情况较为多变的部分,斟酌是否需要以及如何进行调整。针对前述人工智能辅助立法中的潜在逻辑缺陷,人工审查首先应当考察人工智能按“非假即真”逻辑设计的单个法律条文是否符合现实生活的复杂情况,是否需要运用模糊逻辑进行适当的修改;其次应当审查因形式逻辑的机械性、僵化性所可能造成的法律漏洞,主要是思考是否需要增设相关的兜底条款或例外规定;再次应当考察立法文本中需要超越简单的谓词逻辑进行体系解释的条文之间的衔接和呼应情况;最后应当审查与现实情境变迁密切相关的法律条文,判断其是否为司法上的动态解释和自由裁量预留了足够空间。
人工审查的第三个方面是着重考量人工智能辅助立法过程中较为欠缺的因果关系认定和可解释性问题。面对以神经网络为基础的机器学习尤其是深度学习为了追求数据计算和处理效率而牺牲可解释性的技术现实,除了必要的算法透明措施外,就人工智能辅助立法而言,由人类法律知识工程师对作为立法结果的法律规定进行具体解释无疑是一种必要且积极的做法。[50]人类专家在解释人工智能生成法律条文的过程中就可以发现前述因数据过剩、数据匮乏、数据漂移等造成的信息抽取和立法计算问题,也可能发现人工智能潜藏的算法歧视或算法偏见。这事实上是人类理性主义认知和常识对人工智能经验主义统计和计算之不足的弥补。并且,此种构成立法说明和立法理由一部分的解释,对未来的法律适用和法律实施也具有重要的指导作用。
人工审查的第四方面是研究人工智能辅助完成的立法中与社会伦理、人的情感和意向性相关的规范内容是否恰当。法律当中往往蕴含着一些基本的道德伦理要求,例如诚实信用、善良风俗等,它们作为法律的基本原则贯穿整部法律始终,通过若干具体的制度规范得以体现和落实。虽然伦理规范与法律规范一样可以被算法化,但是由于前者更具有先天性、主观性和模糊性,所以其程序框架设计的结果更容易出现问题,更需要人为判断的干预。除了一般的社会伦理外,在具体的社会关系中,法律又是调整人的行为的,因此人在做出行为时的动机、目的、意志乃至情绪等直接关系到法律的适用。人工智能辅助进行法律规范设计时却是将情感计算化和模型化的,[51]这必然与人类情感和意向性的本质有一定的差别。为避免这种差别造成立法的缺陷,有必要通过人工审查重点考量相关法律规范中的主观要件及其对应的法律后果。
人工智能辅助立法在我国理论和实务界都尚未引起足够的重视。现有研究相对有限,大多集中于宏观层面如何加强人工智能的应用,或者立法流程的各阶段人工智能可以发挥何种作用。人工智能辅助立法的实践同样比较欠缺。因此,有必要从理论和实践两方面对人工智能辅助立法进行深入且系统的思考和讨论。
从理论上讲,人工智能主要可以在法律知识图谱构建、逻辑推理框架设计和量化信息抽取处理等方面发挥立法辅助作用。通过对结构性文本、数据和非结构性数据的分析,综合运用规则主导型模式、案例主导型模式和本体论方法,人工智能可以构建法律修正或创制的知识图谱。语义网的建设和自然语言处理技术的应用也可以在立法知识图谱的构建中发挥重要作用。人工智能不仅可以辅助进行一项立法内部的概念位阶和逻辑体系设计,而且可以帮助理顺整体法律框架内不同法律之间的逻辑关系,还可以通过逻辑推理模型进行立法后评估工作。人工智能的聚类算法、强大算力、计算模拟等对于立法所需的信息统计、抽取、分析、处理以及内在制度设计和检验都具有人类无法比拟的优势。
就现实而言,科学立法、精细立法和协同立法的实现都离不开人工智能的辅助。科学立法对于立法多维度合规律性的追求十分依赖人工智能通过信息统计分析和机器学习所挖掘的社会关系运行的各种“规律”。精细立法所追求的立法领域细分性、立法技的精湛性和立法内容准确性都需要借助人工智能在符号处理、逻辑分析和文本挖掘等方面的技术应用。人工智能还可以对协同立法中部门或地区的结构功能、立法权力、立法程序、立法事项和工作机制等的划分和确定起到关键作用。
囿于人工智能技术的整体发展水平和法律人工智能的研究现状,人工智能辅助立法还存在不少潜在问题。无论是法律领域的专用本体论工程还是一般意义上的中文语义网,目前我国都尚未建成。法律和案例数据库的完善程度欠佳,融合网络开放数据的法律知识表示技术不够成熟,法律专家与计算机专家的深度交流合作不足,都影响了立法所需法律知识图谱的构建。符号主义人工智能的形式逻辑框架以及联结主义人工智能的统计概率方法都难以确定事物之间真正的因果关系,因而在辅助立法时就存在着诸多逻辑缺陷。人工智能在辅助立法过程中进行的信息计算可能因数据匮乏、过剩、漂移等带来问题,并且在定性规则的设计上会因过于追求数据化悖离基本的法律价值,还可能存在未被意识到的算法歧视。
基于以上情况,人工智能辅助立法的工作应当在做好充分准备的情况下渐进而行,逐步拓展和普及。首先是要做好法律知识工程的建设工作,包括完善法律文本和案例的数据库,编纂权威且动态更新的在线法学词典,建设一般意义上的中文语义网,加强立法程序和立法技术规范的代码化等等。其次是要在特定类型的立法中进行人工智能辅助的尝试,包括现行法律法规的修正和下位细则性立法、调整对象和范围较为集中的立法、以及与数学计算有较为直接密切联系的金融财税立法等。最后是要对人工智能辅助立法进行人工审查,包括法律用语准确性和一致性的审查、内在逻辑关系及其与现实对应性的审查、因果关系和可解释性的审查,以及是否与社会伦理、人的情感和意向性相适应的审查。
① 与哲学领域的“本体论”旨在研究客观事物存在的本质不同,人工智能领域的“本体论”主要是用来界定相关领域的术语和关系,是工具性和应用性的。在人工智能立法的过程中,由于直接涉及自然语言与算法语言的转换,所以该“本体论”又与关注语言实体、属性和范畴的语言领域“本体论”紧密相关。
钱大军, 苏杭. 人工智能视阈下我国立法决策模式之转变. 湖南科技大学学报(社会科学版), 2018, 21(6): 70-81.
高绍林, 张宜云. 人工智能在立法领域的应用与展望. 地方立法研究, 2019, 4(1): 45-53.
姜素红, 张可. 人工智能辅助地方立法的应用与规制. 湖南大学学报(社会科学版), 2019, 33(4): 139-146.
中国电子技术标准化研究院. 人工智能标准化白皮书. 2018: 13-14.
高翔. 人工智能民事司法应用的法律知识图谱构建——以要件事实型民事裁判论为基础. 法制与社会发展, 2018(6): 66-80.
李菲. 法律人工智能的接近正义面向——以本体方法智能化法律信息供给. 理论与现代化, 2020(1): 61-62.
贾君枝, 毛海飞. 基于法律框架网络本体的语义匹配技术研究. 情报理论与实践, 2008, 31(1): 125-126.
塔内尔·克瑞科密, 桑德·拉萨拉夫. 逻辑与法律推理的自动化模型. 吕玉赞译. 法律方法, 2018, 23: 86–87.
佩德罗·多明戈斯. 终极算法——机器学习和人工智能如何重塑世界. 黄芳萍译. 北京: 中信出版社, 2017: 266–272.
余成峰. 法律的“死亡”: 人工智能时代的法律功能危机. 华东政法大学学报, 2018(2): 9-10.
冯玉军, 王柏荣. 科学立法的科学性标准探析. 中国人民大学学报, 2014(1): 92-98.
黄建武. 科学立法与民主立法的潜在张力及化解. 地方立法研究, 2020, 5(2): 3.
郭秉贵. 设区的市地方立法精细化问题研究. 河南财经政法大学学报, 2020(1): 29-38.
刘长云. 部门利益和地方保护主义法律化的规制研究. 湖南大学博士学位论文, 2016: 83.
张真源. 面向人工智能时代的应急法制体系——以“结构-功能”分析方法为进路. 西部法学评论, 2020(1): 76-77.
刘松山. 区域协同立法的宪法法律问题. 中国法律评论, 2019(4): 66-68.
杨华, 姬东鸿, 萧国政. 汉语语义场网络中的无标度分布现象. 中文信息学报, 2015, 29(3): 35.
魏屹东. 人工智能对不确定性的适应性表征. 上海师范大学学报(哲学社会科学版), 2020(4): 97-113.
玛格丽特·博登. 人工智能的本质与未来. 孙诗惠译. 北京: 中国人民大学出版社, 2017: 40-45.
王涌. 道义逻辑, 人工智能与法律——霍菲尔德法律关系形式理论的应用. 经贸法律评论, 2020(2): 73-83.
赫克托·莱维斯克. 人工智能的进化. 王佩译. 北京: 中信出版社, 2018: 148.
陈亮等. 基于法计算学理论的人工智能辅助决策算法研究. 华东师范大学学报(自然科学版), 2019(5): 88.
杰瑞·卡普兰. 人工智能时代——人机共生下财富, 工作与思维的大未来. 李盼译. 杭州: 浙江人民出版社, 2016: 172–178.
腾讯研究院, 中国信通院互联网法律研究中心. 人工智能——国家人工智能战略行动抓手. 北京:中国人民大学出版社, 2017: 242-243.
皮埃罗·斯加鲁菲. 智能的本质——人工智能与机器人领域的64个大问题. 任莉, 张建宇译. 闫景立审校. 北京:人民邮电出版社, 2017: 134-139.
杜文静, 蔡会明. 法律论证的人工智能模型. 法治论丛, 2019(1): 55.
亿欧智库. AI进化论——解码人工智能商业场景与案例. 北京: 电子工业出版社, 2018: 10.
王禄生. 论法律大数据“领域理论”的构建. 中国法学, 2020(2): 277.
李宗辉,南京航空航天大学人文与社会科学学院副研究员。研究方向为知识产权法、网络与人工智能法。
|