学术研究-学术动态

学术研究当前位置：首页>学术研究>学术动态

教育评价的双重约束——兼以高考改革为案例

2021年03月29日 15:20　来源：《教育研究》2019年第9期　作者：谢维和

关键词：教育评价；科学性；公共性

　　作者简介：谢维和，清华大学文科资深教授(北京 100084)

　　内容提要：教育评价是教育领域中一项非常重要且十分复杂的活动。基于教育评价研究的复杂性、重要性、多因素性，将影响教育评价的各种变量概括为科学性与公共性两种约束。前者要求简明扼要，抓住评价对象的核心，并且受到价值、空间和时间的制约；后者要求扣住教育公平，将教育评价作为一个公共政策，并且从参与和分权的角度描述和分析实现公共性的途径。作为涉及面最大、利益相关者最多、影响变量最复杂的教育评价活动，高考改革同样具有科学性与公共性双重约束。

　　关键词：教育评价；科学性；公共性

　　所谓教育评价，是指“对某个特定的教育项目的执行过程和结果的系统的调查，与‘项目评价’是同义的：这种调查要回应问责，帮助决策，引导项目发展和计划，并且服务研究。在项目评价的意义上，现行的教育评价强调综合性，以及超越单纯依靠定量分析的自然的方法论”[1]。教育评价是教育活动中非常重要的环节，也是一个非常复杂的环节。重要，是因为它在教育活动中具有一种“牛鼻子”的引领功能；复杂，是因为它所涉及的变量和边界条件比较多，而且，这些变量之间的相关性也是模糊的。更重要的是，教育评价又是一种价值判断的活动，具有很强的主观性。在教育的评价研究中，通常要对教育的“某个创新、动议，某项政策或某个项目的价值、优点，以及重要性进行系统的评估和调查。在测量某个创新的价值和重要性时，评价常常用以衡量某些有争议的干预或动议的‘有效性’、‘效果’、‘效率’或‘影响’”[2]。基于它的重要性、多因素性、主观性，参考国际教育百科全书中关于评价的分类①，本文将这些影响教育评价的变量和边界条件等概括为教育评价的双重约束，即科学性的约束与公共性的约束。这种双重约束实际上也就是教育评价的效率与公平的要求，它们之间也是相得益彰和统一的。最后，通过高考评价制度的改革案例，进一步诠释教育评价双重约束的具体作用机制和相互制约关系。

　　一、教育评价的科学性

　　所谓教育评价的科学性，指的是根据科学的要求，对教育活动满足主体需要的程度，或者对教育活动现实的或潜在的价值水平做出判断的过程。教育评价的科学性，具有两个方面的基本含义。首先，按照科学本身的特点和要求，这种教育评价必须进行专业性的分类，即根据教育活动的不同类型进行评价。这是科学性的基本要求，也是科学的特点。分类是保证教育评价合理性的重要基础。无疑，用自然科学教育的规律和价值标准评价人文社会科学教育的发展，显然是不适当的。所以，教育评价的科学性首先要求对评价对象进行合理的分类。其次，教育评价的科学性还要求能够在影响价值判断的诸多相关变量中，通过聚类等手段，发现和找出具有高度关联性的具体变量，或者是需要优先考虑的重要变量，由此能够反映评价对象的价值和功能。需要指出的是，这种具有高度关联性的变量应该符合两个条件。一是数量少，彼此不具有内生性关系。例如，在高中教育定位的评价中，高度关联性的变量就是高中毕业生能够上大学的比例。如果大部分高中毕业生能够上大学，这种高中就是预备型高中；如果只有少数人能够上大学，这种高中则是终结型高中。[3]另外，能否成为世界上优秀青年向往的地方，也是评价一所大学国际化质量与水平的基本指标。变量或者指标过多，往往反映了我们对评价对象核心价值的认识是不清楚的。二是内涵简明，不会产生歧义。例如，在评价大学教师教学的学术性水平时，相关专业领域教师的同行听课是一个比较科学的变量。又如，在高等教育发展阶段的评价中，目前比较公认和简单的标准就是适龄人口接受高等教育的比例，达到15％即为大众化阶段，达到50％则为普及化阶段。而寻求这种具有高度关联性的变量则是影响教育评价合理性的重要工作。

　　一般而言，教育评价的科学性约束包含了三个非常重要的制约性因素。

　　首先，是对评价对象的价值认识，即评价对象本身最核心的教育意义与价值是什么。②这是保证教育评价合理性与科学性最根本的制约因素。由于教育内部各个因素之间的相关性非常模糊，有的专家甚至认为，“学校组织几乎是一个从来没有人知道和了解的黑箱……其中的变量和边界条件仍然是十分复杂的。它们并不是一种简单的线性关系”[4]。所以，究竟什么变量对学校的办学水平或学生的学习发展具有更重要的影响，一直是教育评价中非常关键的问题。同时，按照科学的要求，不同的教育活动都具有不同的价值。因此，教育评价能否充分准确地识别该教育活动的核心价值，是关系教育评价科学性最重要的条件。例如，对于学者学术研究能力与水平的评价，就不能仅仅考虑论文发表的数量，而应该根据已经被学术界认可的“代表性论文”的标准进行评价，由此能够更好地反映学者的学术水平。因为这种“代表性论文”对于反映学者的研究深度和专业水平等，都具有高度的关联性。而单纯的数量指标则容易出现偏颇。又如，在教育活动核心价值的识别方面，体育的评价特别具有典型性。显然，体育的评价并不能单纯根据学生的身体素质与运动成绩进行，这对于身体素质不同的学生是不合理的，也不反映体育本身的核心价值。对此，梁漱溟先生有一段非常经典的论述，“体育并不是为军事或其他特殊目的训练，亦不是单单为了锻炼人身的体力和敏捷。体育的目的，是全人格的发展。它要联合教育和锻炼以发展人类和动物不同的地方，这当然不仅是身体的发育，一个人纵然经长久的锻炼而能有强大的体力和敏捷的技能，亦决不能赶上牛的体力和猿的敏捷。但他能超越各种动物之上，只是因为他能用他的意志来驾驭他的身体”[5]。而这种意志力的训练和培养，以及由此所体现的自律的道德品质的养成，正是体育最根本的价值，它当然也是体育成绩评价的主要标准。

　　其次，是教育评价的空间因素，即评价对象的空间特点对教育评价的制约。显然，教育评价对象的意义和价值与其所处的空间具有非常密切的关系，甚至可以认为，这种空间特点对教育活动的要求是不同的。例如，从中国高等教育的实际而言，教育部直属的高等学校与地方高等学校的空间特点就是不同的，由此也决定了它们的服务对象与评价标准是不同的，不能简单地将教育部直属高等学校的评价标准应用于地方高等学校。20世纪90年代后期的高等学校教学评估中，曾经就教育部直属高等学校教学评估的成绩与地方高等学校教学评估的成绩如何评定进行过讨论，即两类高等学校教学评估的“优秀”是否应该有所区别？经过教育部第一届本专科教学评估专家委员会的讨论，最后非常明确地决定，两者的优秀应该是同样的。因为，两类不同高等学校的空间特点及其服务对象是不同的，只要他们能够为各自的服务对象提供高质量的教学服务，就都达到了优秀的水平。办学层次指的是服务对象的差异，而办学水平指的是服务质量的高低。所以，高层次也可以由于服务质量不高而水平低；低层次也完全能够通过高质量的服务而达到高水平。[6]而这种差别则是由于教育活动的空间特点决定的。忽视教育活动或者评价对象的空间特点的评价是不合理的。更重要的是，充分考虑教育活动的空间特点的教育评价，能够非常有效地引导地方高等学校更好对服务地方社会经济文化的发展，并且对教育部直属高等学校形成更高的要求。

　　再次，是教育评价的时间因素，即根据教育活动的时间特点或者时效特点进行评价。众所周知，时间或时效是教育活动的一个非常突出的特征，教育作为社会的一种预期的委托，它的效果往往需要比较长的时间才能够比较充分地反映出来。然而，教育活动的这种时间性或时效性在不同学科也具有不同的特征，进而成为不同学科评价的重要制约条件。其中，理工科和人文社会学科的研究成果的时间性或时效性就非常不同。同时，相比较应用研究的评价，基础研究的评价则需要更长的时间周期，甚至是十几年或者几十年。对此，有一个非常典型的研究成果说明了这种学科之间的差异。美国著名社会学家莫顿(Merton，R.K.)的学术著作中介绍了一个关于不同学科研究论文引文的比较研究案例。他发现，在自然科学研究论文的引文中，大多数都引自论文发表前五年的研究成果。如在物理科学中，以《物理学评论》和《天体物理学杂志》为代表，大约60％～70％的引文来自五年内的出版物，而出自于五年前论文的引文则比较少。在社会科学研究论文的引文中，出自于前五年研究成果的引文数量则比较少。如在社会学科中，以《美国社会学评论》、《美国社会学杂志》和《英国心理学杂志》为代表，30％～50％的引文来自于五年内的出版物。而在人文学科研究论文的引文中，出自于前五年的引文数量则是最少的。如在人文学科中，以《美国历史评论》、《艺术论坛》和《美学与艺术批评杂志》为代表，10％～20％的引文来自五年内出版物，而大多数引文都出自五年前的，甚至更早的研究成果。[7]这一研究案例充分说明，自然科学的评价与人文社会科学的评价具有非常不同的时间周期。前者往往比较短，而后者的时间更长，不能简单地“一视同仁”。这也就充分说明，教育评价应该考虑不同对象的时间或时效特点，尊重不同学科的时间特点。由于目前在教育评价中越来越重视学术论文的引文数量，所以，这个案例对于进一步完善我们的评价体系，具有非常重要的参考价值。

　　显然，科学性是教育评价的基本约束，也是保证教育评价合理性的基础。它需要对评价对象的意义和价值有充分准确的认识，并且进行科学的分类和提炼。

　　二、教育评价的公共性

　　所谓教育评价的公共性，指的是教育评价本身具有一种公共政策的属性和特点。所以，教育评价属于公共政策的范畴，它的合理性也必须受到公共政策的约束与规范。

　　教育评价的公共性与教育活动的基本属性是紧密相关的，也是教育活动的外溢性(或称为外在性)所决定的。诸如弗里德曼(Friedman，M.)、卢卡斯(Lucas，R.)等著名经济学家都非常鲜明地从教育外溢性的产生主体和接受主体的角度，说明和讨论过教育活动的这种外溢性。[8]而国内也有学者非常明确地指出，教育具有巨大的外部效益，它可以使个人和社会都获得很大的经济和非经济的效益。[9]当然，教育的这种外溢性具有正反两种不同的效益。它有可能形成非常积极的外溢性，但也可能由于教育本身的问题而产生消极或者是负面的外溢性。为此，教育活动的评价不能不成为公共政策的一个非常重要的议题。特别是在现代社会，随着教育的普及及其对人们发展的重要性，它已成为人们最直接最关心最现实的利益问题。[10]在许多国家，教育的议题常常是国家领导人特别关注的一个领域，是国家公共政策中越来越受到关注的议题，甚至成为国家主要领导人施政和演讲的重要内容。

　　如果说教育评价的科学性所追求的是教育活动的效率，那么教育活动的公共性主要表现为教育公平的要求。而且，这两者之间也是统一的。在现代社会，教育公平本身也是教育质量的主要内涵，是教育活动合理性的基本要求。能否保障教育公平，并且不断提高教育公平的水平与层次，是教育现代化的重要目标。所以，教育公平是教育评价公共性的重要内涵。而教育活动及其评价的公共性的主要目的之一就是不断维护和促进教育公平，并且能够更加有效地提高教育评价的科学性。当然，由于时代的发展与教育本身的进步，教育公平本身也具有了更加丰富的内涵与新的特点。在21世纪，教育评价的公共性约束对教育发展的意义至少具有三个新的特点。

　　第一，教育公平已经成为影响人们发展与社会进步的自变量。教育公平所依据的传统的“基本平等”的理论和观念，正在发生一种非常明显的变化。根据贝克(Beck，H.)的观点，所谓的“基本平等”是所有平等理论的基本原则。“这种观念就是人类在尊严和价值上是平等的，因此值得平等地被关心和受尊重”。由于在这里平等是作为因果关系中的结果而出现的，所以，“它用基本上是消极的术语定义了平等，用的是来自平等的自由，而不是走向平等的自由的话语”[11]。而新的教育公平已经开始用更加积极的术语进行定义，即教育公平并不是作为因果关系中的结果或“因变量”，而是成为人类发展中的“自变量”，成为人们其他方面平等的重要原因。所以，教育公平受到了全社会越来越大的重视和关注。在中国社会中涉及民生的教育、医疗卫生、就业、收入分配与社会保障五大领域中，教育成为首要的问题。[12]

　　第二，教育本身的差异性对教育评价的公共性形成了更加严峻的挑战。显然，义务教育的“普九”，特别是高等教育的大众化，以及很快即将实现的普及化，是教育公平的一个非常重大的进步。它为更多的人提供了教育机会。然而，这种教育参与水平的提高和程度的扩大，对教育评价的公共性提出了更加严峻的挑战。因为，这种参与水平与程度的提高也从客观上扩大了教育内在的差异性，包括教育本身的分化、不同的利益相关者对教育的不同诉求，以及受教育者本身学业水平和文化基础的差别，等等。如何能够更好地满足不同利益相关者的要求，提供适应不同个性、条件与需求的受教育者的要求，促进人们的共同发展和社会的公平，也将成为教育公平的新难题。尤其是在社会转型期间人们参考群体的变化，以及在比较过程中相对剥夺感的强化，人们对教育公平的关注和诉求变得越来越强烈。

　　第三，结果公平逐渐成为人们追求教育评价公共性的主要目标。21世纪的社会发展与教育改革中，教育公平的目标正在发生变化。根据有关学者的研究，机会平等是根据相对处境不利人群在分层化社会和教育系统内所受不同水平的教育确定的。参与平等超越了机会平等阶段，是根据参与率而不是机会率和/或不同群体在教育的不同部门和领域内经历的、参与的质量和性质来测量的。而结果或成功平等则是依据教育内部边缘人群的教育成就或成功率来测量的。在此过程中，大学教育经常被含蓄而非明确地确定为教育成功的顶点。[13]显然，目前中国在高考改革中所面临的挑战，恰恰反映了这种结果的公平，正在成为人们追求教育公平的目标。因此，教育评价的公共性约束必须协调教育领域不同利益相关者的诉求，在保证教育的机会公平、参与公平的同时，力求不断实现教育的结果公平，进而最大限度地实现整个社会的教育公平。所以，教育评价的公共性约束对教育改革发展具有导向功能，有助于教育资源的合理分配，规范利益相关者的行为，协调各种矛盾，进而促进教育的发展。如果用一个并不太恰当的比喻，这种教育评价的公共性正如同让具有不同口味的人都能够认同某顿宴席的菜肴一样，关键并不完全是饭菜的质量高低，而更主要的是寻求不同用餐人之间的共识，包括相互协调，以及彼此之间一定程度的妥协。而这正是公共政策的主要功能与价值之一。

　　一般而言，这种教育评价的公共性和相关公共政策的制定有两种不同的实现途径与环节。首先是根据公开、公正与规范的程序与方式，通过有代表性的利益相关者的参与，对教育的某项公共政策议题进行广泛的讨论，尽可能由此获得最大程度的共识。这种公共参与是教育评价的公共性约束的非常重要的途径与形式，是保证和提高教育评价合理性的必要程序和环节，也是制定教育评价标准的重要社会基础。例如，某大学在制定教授与副教授职称的评审标准时，由于涉及不同学科与不同类型的学术领域，学校首先将相关文件草案中的有关标准条款交付不同院系有关教师进行讨论和征求意见，并且根据学校的整体要求与不同方面的意见进行多次修改完善，最后交由相关院系的全体教师进行投票，在经过规定的多数同意后便成为正式的评审办法和文件。又如，在学科评估的过程中，由于涉及不同地方与不同学科之间的差异，为了能够形成大家对评估标准的共识，有关主管和实施部门邀请有关方面的专家和代表，对评估方案进行讨论，提出意见，进行修改完善，最终在综合不同方面意见与建议的基础上，形成评估方案。其次是通过放权或分权的途径与方式落实和体现教育评价的公共性。在某些教育活动的外溢性本身具有比较大的差异、冲突和分歧，进而难以通过某些适当的程序形成一定的共识和统一的评价方案时，往往需要通过放权或分权的方式实施教育评价。这种放权或分权的教育评价指的是，通过委托或者授权的机制，由不同层次和类型的评价机构，根据一定的原则，对相关教育活动和教育机构进行评价，由此保证教育评价的合理性。教育评价的这种分权或放权是必要的，也是合理的。特别是对于教育活动中某些专业性非常强的领域和部门进行评价时，常常很难在具有专门性的不同教育活动中达成共识性的评价标准和方案，而不得不委托或者授权专业性的机构进行评价。例如，在某大学文科建设过程中，由于涉及管理、经济、法学、文史哲、艺术等不同的学科与领域，学校在明确提出“质量优先”的基础上，在学术评价上实施了“基层优先”的政策取向，充分尊重不同学科的特点。学校文科并没有制定完全统一的评价标准和考核要求，而是依据基本的原则，允许各个院系(所)根据自己的实际情况制定本院系所的评价标准和考核要求，基本实现了评价的多样性。[14］需要指出的是，虽然这种放权或分权具有一定的差异性，但它却是更加公平合理的。因为，它能够适应不同学科和专业领域的特点与具体规律，建立起更加实事求是的参照标准，因而也更能够得到人们的认可，进一步促进教育的改革发展。当然，这种放权或分权并非没有统一的要求，或者说单纯的放任。它通常是一种集中与分权的统一。在上述案例中，学校也非常明确地提出了以“国家水准、世界影响、历史检验、实践贡献”的要求，以及“三个影响力”的引导，即学术影响力、社会影响力与国际影响力，强调文科发展与国家、高等教育强国和世界一流大学的“交集”。[15]实践证明，通过这种有导向的放权或分权实施教育评价，往往能够更好地实现教育评价的合理性和公平性，有效地推动教育的改革发展。

　　可以看到，教育评价的公共性与科学性之间并不是矛盾的，而是统一的。因为，其公共性能够更好地实现教育评价中共有价值的最大化和均衡化，获得不同利益相关者最广泛的认可，而这也正是科学性的内在要求。

　　三、高考改革的双重约束

　　高考制度是中国教育领域中涉及面最大、利益相关者最多、影响变量也最复杂的教育评价活动。而这种教育评价的双重约束对于进一步提升高考制度的科学性和公平性、促进高考制度的合理性，都是非常重要的。

　　（一）高考改革的科学性约束

　　高考制度的科学性约束主要表现为按照高考的规律制定相关的各项政策、进行命题考试、评分和录取等，其中，能否真正抓住高考内容的核心价值，是高考制度合理性的根本和基础。

　　显然，在高等教育大众化并走向普及化的发展阶段，作为基础教育与高等教育之间相互衔接的重要环节，高考制度在坚持立德树人基本导向的基础上，同时承担着服务选才和引导教学的功能。它既要为高等学校选拔各类不同的优秀人才，又具有引导基础教育教学的功能。二者都是高考制度非常基本的重要功能。但是，如何在高考制度中将二者有机地衔接和协调起来，则是高考制度中最主要的矛盾之一，也是高考内容选择、组织与系统化过程中最大的挑战和难题。高考内容的合理性在很大程度上取决于能否科学地协调这样两个基本功能，它直接关系高考制度的基本功能和核心价值能否真正落实，也是高考制度的科学性约束中非常根本的内涵与对象。

　　基础教育和高等教育虽然同属教育，遵循着教育的一般规律。但它们是有差异的。它们不仅是两个不同层次的教育，也是两种不同类型的教育，它们的基本原理、办学定位和培养途径也是有所不同的。作为高考制度中非常重要的内容改革，则是直接意味着基础教育和高等教育中不同课程体系、教育教学内容及其组织形态的衔接。而高考制度的科学性约束，则要求将二者科学地衔接和协调起来。

　　从高考内容改革的角度分析，科学性约束的主要任务包括三个方面。

　　第一，对两种不同课程内容进行衔接与协调，寻求内容上的“交集”。不待言，基础教育与高等教育在教学内容上存在着非常明显的层次差别。基础教育的课程内容更多的是普通知识；而高等教育则更强调专业知识。基础教育的课程内容更加侧重于人的培养；而高等教育的课程内容则更多的重视人才的培养；基础教育的课程往往更加注重基础性知识与能力的学习和训练，而高等教育课程则常常突出高深知识以及研究型能力的钻研与训练，等等。显然，这两种课程内容的协调与“交集”是高考内容合理性的重要方面。

　　第二，对两种不同课程的逻辑进行衔接和协调，寻求高考内容编排方式的“交集”。显然，基础教育与高等教育课程内容的编排方法或逻辑是不同的。这种课程逻辑的差异直接影响了基础教育与高等教育在讲授与学习方法上的不同，以及课程评价方面的差异。对此，美国著名教育学家杜威(Dewey，J.)曾经有一段非常重要的论述，他指出，每种学科或科目都有两个方面：一方面是就科学家作为一个科学家来说；一方面是就教师作为一个教师来说。这两方面绝不是对立的或互相冲突的，但又不是直接地完全相同的。照科学家看来，教材不过代表一定的真理，可用来找出新问题，开展新的研究，并贯彻执行以达到验证的结果。对科学家来说，科学中的教材是独立的，他把其中各种不同的部分相互归类，并联系新的事实以相印证。作为一个科学家，他从不超越他的特定范围之外，即或有的话，也只是搜集更多的同类的事实。教师的问题就不同了。作为一个教师，他并不关心对他所教的科目增加些新的知识，提出新臆说或证实它们。他考虑的是科学的教材代表经验法则的某一阶段或状态。他的问题是引导学生有一种生动的和个人亲身的体验。因此，作为教师，他考虑的是怎样使教材变成经验的一部分；在儿童的可以利用的现在情况里有什么和教材有关；怎样利用这些因素；他自己的教材知识怎样可以帮助解释儿童的需要和行动，并确定儿童应处的环境，以使他的成长获得适当的指导。他考虑的不限于教材本身，他是把教材作为在全部的和生长的经验中相关的因素来考虑的。这样看，就是使教材心理化。[16]不难发现，这两种课程逻辑的协调与“交集”也是高考内容合理性的内在要求。高考内容的改革及其合理性正是需要去认识和发现基础教育课程的心理化逻辑与高等教育课程的科学化逻辑之间的“交集”，进而有机地将两者协调起来。

　　第三，对两种课程形态的衔接和协调，寻求高考内容形态与结构的“交集”。我们可以看到，基础教育与高等教育课程内容的组织形式是不同的，尽管基础教育和高等教育的课程都与“学科”相联系，但它们的含义是非常不同的。基础教育中的学科往往等同于课程，学科评估即相当于课程评估，而在高等教育中，不同的课程本身就是某个学科的重要内涵之一，与学科的其他因素紧密联系在一起。课程评估则属于学科评估的一部分。这两种学科形态上的差异在英文的表述上则是subject与discipline的不同。由此则更能够反映出两者的差异。前者常常具有一种“主题”的含义，由此将相关知识结合在一起；而后者则具有一种规约的意思，体现了一种知识体系的边界和限制。这种差别是两种教育中非常重要的不同，也是两种教育各自的重要特点之一。它反映了不同的学习模式，体现身心发展不同阶段的教育规律。当然，高考内容的改革及其合理性也要求将知识的这两种组织形态协调起来，寻找和发现它们之间的“交集”。更加直接地说，这种协调和“交集”应该体现在高考的试卷结构和命题形式上，科学地将具有两种不同逻辑和形态的知识，以及相关的学习方法和思维方法协调和结合起来，才能够真正体现高考制度在服务选才与引导教学上的功能，进而实现高考制度的核心价值。

　　（二）高考改革的公共性约束

　　所谓高考制度的公共性约束，主要指对高考制度公平性的程序性约束，包括对高考科目的选择、统考与选考的比例、统一与自主考试的政策、赋分的权重、时间的安排，以及相关的各种制度安排公平性的程序性要求。由于高考制度本身关系千家万户的利益，在教育公平上是一个高度敏感的教育评价活动，甚至在一定程度上涉及国家和社会的稳定，因此，高考制度的公共性约束是关系高考制度合理性的关键环节与要求。

　　实事求是地说，由于社会和教育发展的不平衡与利益的分化，高考内容的改革与完善虽然具有必要的科学性约束，但仍然很难得到整个社会不同阶层、不同地区和利益群体之间完全一致的认可。某些地方高考制度的改革之所以受到一些批评，也许主要并不是科学性方面的问题，而更多的可能是公共性方面的问题。所以，这种公共性约束就显得更加重要。高考制度作为一个国家和社会最重要的公共政策之一，如何能够在社会不同阶层、地区和利益群体之间取得最大程度的共识，直接关系高考制度的成功与合理性。从这种定位和要求来看，结合目前的现实，高考制度的公共性约束主要应该落实在三个方面。

　　第一，高考制度改革的公众参与。公众参与是高考制度的公共性约束的主要形式和途径之一。它的基本形式之一是邀请不同群体或者利益相关者的代表，共同就高考制度，或者高考内容的改革等，进行交流和磋商，广泛征求意见，听取各方面的想法，包括各种不同取向的意见。在这种公众参与的过程中，甚至可以进行不同看法之间的交流与讨论。其目标是尽可能地争取实现不同利益群体的诉求之间的协调与最大共识的达成。当然，这种公众参与的形式和途径也可以是多种多样的。笔者曾经参加的世界银行两个教育贷款项目的社会评估，则是其中一种比较典型的例子。当时，世界银行为了使教育的贷款项目不仅能够提高办学效率，而且可以最大程度的实现公平，扩大受益面，便委托独立的第三方专家小组，对各个贷款学校和机构的可行性报告进行社会评估。简单地说，这种社会评估的基本形式就是对相关项目的利益相关者进行科学的抽样，然后通过问卷与访谈等田野工作的形式，广泛听取各个方面的意见，主要是他们对项目实施对各自的利弊的看法和认识，并且进行归纳和总结，进而形成对相关学校和部门的可行性报告，以及整个项目提出建议性的修改意见。而且，这种社会评估，也是世界银行执委会决策中一个非常重要的参考性根据。

　　第二，高考制度的分权安排，包括区域性分权、类型性分权、层次性分权等制度安排。公共性约束的目标是不同地区、不同类型、不同层次之间共识的达成；高考制度既要满足国家的统一性要求，又要适应不同地区的特点，这是高考制度中又一个主要矛盾，也是高考制度中程序性制度设计和安排中最关键的公共性约束。然而，由于社会的分化程度越来越高，教育本身的差异性也不断扩大，人们之间的利益诉求也出现了多元化的趋势，同时，不同地区基础教育发展水平也存在不平衡的现象，因此，国家的高考制度或者高考内容往往很难单纯通过公众参与的途径，实现基本或最大多数人的共识。在这种情况下，公共性约束将不得不采取分权的形式。所以，高考制度的公共性约束的第二种基本形式和途径是分权。

　　高考制度的分权可以包括四种基本形式。首先，是不同地方的分权，即由于某些省的特殊原因，可以通过有限的委托或者授权的方式，允许其实行自主高考。如前些年若干省、直辖市和***的自主高考。其次，是单独命题的形式。即有些地方本身具有一定的特殊性而很难纳入全国性的高考，而又需要国家的指导和帮助，可以通过国家有关部门根据该地区的特点，进行单独命题，进而适应地方教育发展的需要，实现高考制度的基本功能与核心价值。例如，近年来我国高考的几套试卷正是满足这种差异性的要求。再次，是不同层次的分权，根据高等教育体系内部的不同层次，即教育部直属高等学校、地方本科院校、地方专科院校等，进行高考制度的分权。例如，教育部直属高等学校由于是面向全国招生，并且以整个国家为服务对象，故必须参加国家统一的高考。当然，地方本科院校中的某些重点学科或专业，也可以根据某些程序和条件，自愿申请参加国家统一高考；而地方高等学校由于以地方招生为主，并主要为地方服务，则应该更好地适应地方的特点，因此可以通过适当的委托和授权，实行地方自主高考，而不必参加国家统一高考。而对于某些专科院校，甚至可以在保证公平和质量的条件下，采取注册入学的形式。最后，不同类型高等教育的分权。例如，高等职业教育的高考可用根据职业教育的特点和要求，实行适当的委托、授权，或者实行单独命题等形式，进而更好地满足和适应职业教育发展的要求。当然，这种分权并不是绝对的，它们也都可以是与国家统一的高考制度或者高考内容相结合的分权或授权。

　　需要指出的是，高考制度或者高考内容的这种分权并不是放弃教育公平，它恰恰是为了实现更合理的教育公平。一方面，以某种统一的内容对不同地区、不同层次和不同类型的高考进行评价，常常很难达到教育公平的目的；另一方面，从教育公平的理论上分析，这种通过分权的方式实施高考，则更加符合现代社会不同利益群体对教育公平的主观感受。因为，根据教育社会学的基本理论，在社会不断分化与地区发展不平衡的情况下，人们对教育公平的诉求往往具有组内公平先于组间公平的特点。这也是教育公平理论的优先顺序。因为，人们常常都是根据自己身边的参考群体对教育公平进行判断和评价。

　　当然，这种放权并不是放任，而是一种在统一指导和原则下的放权，甚至是一种集中与放权相结合的分权。国家主管部门具有对这种高考制度的分权进行直接指导和监督的权限，这也是国家主管部门的责任。

　　第三，高考制度的稳定性。高考制度的稳定性也是教育评价或者高考的公共性约束的重要内涵之一。这种稳定性的要求，既符合教育评价的基本特点和规律，也适应了人民群众对高考制度改革完善的要求。

　　高考制度的稳定性至少包括两个方面的含义：其一，高考制度或者高考内容的改革决不能过于频繁，更不能朝令夕改。它应该具有一个底线的周期或时限。如老子在《道德经》中所述，“治大国如烹小鲜”。在中国这样一个人口众多、发展如此不平衡的大国里，尤其应该重视这种稳定性。理论与实践已经充分证明，过于频繁的高考改革只能给教育发展带来消极的影响。其二，高考制度或者高考内容改革的连续性。随着社会的发展、科技文化的进步，以及教育的改革，高考制度与高考内容也必须与时俱进。毕竟21世纪初的高考与20世纪70年代末的高考具有非常不同的时代背景和社会诉求。但是，高考制度或高考内容的改革必须有一种连续性，它更多的应该是小改，尽量避免大改。无疑，中国的高考改革应该参考经济社会改革的渐进性模式，但是，它又应该尽可能避免经济社会改革的渐进性模式过程中，由于矛盾和问题的累积而出现的阶段性节点，以及在这种阶段性节点中发生的爆发性“应力”。这也是高考改革，包括教育改革不同于经济社会改革的方面。所以，高考改革，包括高考内容的改革，应该坚持渐进性的模式，同时有计划地逐步消解各种累积的矛盾。

　　高考改革的稳定性作为公共性约束的重要内容之一，其目标是为人民群众和利益相关者对高考提供一个比较稳定的社会预期，给中国的基础教育和高等教育的改革发展提供一个比较稳定的制度环境。这是保证高考制度合理性的重要基础。

　　显然，高考评价制度的公共性与科学性之间也是统一的。因为，无论是高考评价改革的公众参与，还是分权、稳定性，都有助于实现高考评价的效率和科学性。试想，如果高考评价能够充分反映基础教育与高等教育之间不同的诉求，协调不同变量之间的张力，体现不同层次、类型学校和地区的特点，以及教育活动稳定性的内在要求，必然可以更好地协调服务选才与引导教学的目的，适应不同层次、类型高校和地区的要求，进一步提高人民群众或不同利益相关者对高考评价制度的认可与满意度，实现高考评价制度的价值的最大化。

　　教育评价是一项非常复杂的教育活动，涉及的变量非常多。高考制度的改革也是众目睽睽、牵一发而动全身的公共政策，本文所提出的科学性约束和公共性约束只是其中两个比较重要的方面，但也是非常关键的基础性的因素。

　　注释：

　　①《劳特利奇国际教育大百科全书(The Routledge International Encyclopedia of Education)》将评价分成不同的类型，其中基本的两种类型是：民主的(democratic)，或者称为“参与性的”(participative)，相对于“不民主的”(non-democratic)；科学的(scientific)，或者称为“实验性的”(experimental)，相对于“自然的”(naturalistic)。

　　②各种教育工具书在涉及教育评价时，有两个名词：evaluation和assessment。本文在讨论教育评价时，区分了教育测量与教育评价或评估的不同，更多地将教育测量看作为一种基本的评价步骤。而教育评价或评估则着重于对测量结果的一种价值判断。本文主要讨论教育评价或评估。

　　参考文献：

　　[1]John.W.,et al.The Greenwood Dictionary of Education[Z].Greenwood Press,2003：130.

　　[2]McCulloch,G.,Crook,D.The Routledge International Encyclopedia of Education[Z].London:Routledge Taylor & Francis Group,2008：236.

　　[3]Trow,M.The Second Transformation of American Secondary Education[J].International Journal of Comparative Sociology,1961,(2).

　　[4][11][13]莫琳·T.哈里楠.教育社会学手册[M].上海：华东师范大学出版社，2004.50、119、121.

　　[5]教育与人生：梁漱溟教育文集(上编)[M].北京：当代中国出版社，2012.

　　[6]谢维和.办学层次等于办学水平吗？[N].中国教育报，2014-11-21.

　　[7]罗伯特·K.莫顿.社会理论与社会结构[M].南京：译林出版社，2006：46.

　　[8][9]许长青.教育投资的外溢效应及其内在化[J].教育学术月刊，2015，(3).

　　[10]中共中央关于全面深化改革若干重大问题的决定[EB/OL].新华网，2013-11-15.

　　[12]中共十八届三中全会在京举行[N].人民日报，2013-11-13.

　　[14][15]三个优先与政策引导[N].光明日报，2011-11-25.

转载请注明来源：中国社会科学网 （责

苏ICP备2021007725号 苏公网安备 ©2020江苏省教育学会版权所有 建议使用IE10以上版本的浏览器浏览页面，建议使用火狐、360浏览器极速模式

苏ICP备2021007725号苏公网安备
©2020江苏省教育学会版权所有
建议使用IE10以上版本的浏览器浏览页面，建议使用火狐、360浏览器极速模式