音乐心理测量和统计的两种新技术
――实时测量和元分析的应用
New Techniques in Measurement and Statistics
of Music Psychology
----Real-Time Testing and Meta-Analysis
刘沛、丁东红
【内容提要】实时测量和元分析的统计方法,是音乐心理学研究界新近开发和应用的研究方法。本文描述了这两种研究方法在国外音乐心理、治疗和教育研究中的发展状况,并分析了其应用价值。
【关键词】音乐心理;测量;统计;CRDI;元分析。
【内容类别】音乐心理学;音乐治疗学;研究方法。
CRDI:从非实时到实时音乐心理测量
20世纪80年代之前,音乐心理学和音乐治疗学研究涉及的音乐情绪反应和音乐认知反应的测量,多采用问卷、形容词核对表、单维度或多维度量表以及操作反应观察的方式。这些测量方式为音乐情绪和音乐认知的研究收集了大量的数据。但是,这类方法的最大缺陷,在于与音乐的时间性质相悖。它们收集的数据,是被测在聆听音乐之后依赖记忆所做的反思。另外,这些方法在音乐情绪和音乐认知反应的研究中,不能与音乐的进行过程实施实时的记录及再现,不能使研究者对音乐进行和被测反应之间的同步关系做出全面、反复、精确和深入的观察。简言之,这些测量及记录方法是非实时的。
从20世纪80年代初起,研究者从技术和装置入手,开始解决音乐心理的非实时测量与音乐进行的时间性之间的矛盾,使音乐心理学和音乐治疗学的测量技术进入实时反应和记录的时代。
实时测量技术,最早的形式是Clynes于1982年研制的“情绪记录器”(Sentograph),用于测量被试对音乐的情绪反应。这种简单的装置上设有一个万向的按键,被试根据对音乐情绪反应的不同描述和强度操纵此键,便可将不同方向和压力的操作按不同类别和比例,转换成相应的电压,并给予与音乐进行过程同步的记录。
1983年,Nielsen又设计出一种簧制的夹钳,用于研究被试在音乐进行过程中对音乐紧张度的实时反应,并可将被试在研究过程中的持续反应绘制成图形。这种装置所记录的数据,在后来的验证性实验中表现出很高的效度。
1991年,Namba等人在音乐情绪反应的系列研究中,利用现有的计算机键盘,开发出一种“选择性描述连续判断方法”(the method of continuous judgment by selected description)。研究者把用于不同类别情绪感受的形容词指派于特定的键,被试接受半小时的实验指导训练后,在音乐进行过程中根据自己的情绪感受及与之相应的形容词描述,在键盘上连续操作相应的键。这种实时反应与记录的方式,可以把被试的反应以多维度的形式与音乐同步记录和贮存在计算机内。
20世纪90年代初,美国佛罗里达州立大学音乐研究中心在Madsen领导下,研制出“连续反应数字接口”(Continuous Response Digital Interface,简称CRDI)。这是一种电位器与计算机实现数字接口的技术。在音乐认知或音乐审美情绪反应的研究中,被试在聆听音乐的全过程中,根据实验的具体要求,可以在250度范围内拨动带有一枚凸针的旋钮,连续不断地对音乐进行过程中情绪或认知在两极范围内的反应及变化,同步地进行调整。被试在操纵旋钮时,实际上是将不同的电压持续不断地输入计算机,并经计算机处理,绘制成为与音乐进行的时间横轴线实时发展,依输入强度变化形成的曲线图。这种旋钮操作输入的信号的变化是无级的。CRDI的另一种输入方式,是11点量表型的滑杆。它以零为中心,依据反应强弱程度的不同,使被试可以在+5和-5之间的11个点位上,连续不断地调整滑杆在量表上的不同位置,以达到输入反应强度的目的。
上述测量和记录方法,可以用计算机对若干被试的各个反应曲线进行集合处理,使之成为能够反映被试整体反应的曲线。
值得一提的是,与连续反应数字接口相类似的技术,20世纪80年代后期在我国已有研制,不过没有直接应用于音乐心理的研究,而是应用在被试对视听电教材料的注意实验中,其范畴属教育技术学的心理生理基础研究。研究者黎加厚开发的装置,由两部分组成。一方面,将传感器和A/D转换器与计算机连接,把被试在接受视听电教材料刺激作用下的皮肤电阻(GSR)及其变化的全过程输入计算机;另一方面,用摄像机对被试在实验过程中的外部变化过程给予摄制。经后期合成,视听教学材料的画面(包括背景音乐),被试表情和动态,以及被试的皮电阻反应曲线这三个画面同步地实时记录于VCR,可供研究者反复观察并做统计处理。笔者认为,音乐心理和音乐治疗可以直接采用这种技术,开展音乐心理生理学有关不同音乐要素或音乐风格与情绪反应关系的实验。
自从Madsen等人首次使用CRDI技术,对音乐审美体验给予实时测量以来,近八年中CRDI技术在美国音乐心理、治疗和教育研究中所涉及的课题大致包括:音乐听赏过程中的注意焦点;儿童音乐偏好;音乐审美体验;听赏者差异;音乐要素(速度、音准、力度、节奏、旋律、音色等)与认知和情绪;音乐紧张度的感知等等。另外,由于CRDI是一种非词语和过程性的测量,研究课题还涉及非词语和词语,以及形成性与终结性测量的信度。此外,近两年来,随着研究者探讨课题的深入,CRDI描述的刺激反应维度也从单一维度向多维度发展。
CRDI技术在音乐心理测量以及与音乐心理直接相关的实验美学、教育、医疗、社会心理学等领域的应用价值无疑是巨大的,这里仅举一例。1989年,在中国音乐治疗学会成立大会暨第一届年会上,一位医生曾提问:“音乐处方的开具依据是什么?”他的意思是明白的,当然不能仅仅天真地诉诸于音乐作品的标题。如同一剂药品必须通过大量的严格验证才能投入临床使用一样,在音乐治疗中,音乐作为处方,虽然不大可能使人 “中毒”,但是从科学的角度讲,也应该就音乐的某种或某些成分以及它们所构成的整体与接受者之间的关系,在情绪、感知或生理、神经诸多方面给予实时的测试和验证,以便达到最佳的预期效应。就这一点而言,实时测量的概念和方法是必不可少的。
元分析:从“见树”到“见林”的音乐心理统计
这是一个由音乐心理的定量研究方法与研究结论的定性概括之间关系引发的课题。作为一门科学,心理学随定量研究方法的应用得以建立和发展。定量研究是心理学的既定学术规范。音乐心理研究作为分支心理学科,同样是把主流心理学的定量实证作为它的基本研究范式的。在近一个世纪的漫长岁月后,实验音乐心理研究者逐渐认识到,由于实验设计必须对变量进行控制,所以少量的音乐心理定量实证研究不可能为这个领域的重大课题提供现成答案。当某一相同或相近课题的量化实证研究达到充分的积累时,情形依然如此。即便是相同的研究课题,受研究变量、被测状况、测量工具以及其他种种条件的影响,它们的结论,主要是统计的差异显著性,会是不同甚至相反的。过去,对已有大量的相同或相近课题研究结论进行概括时,研究者的方法是粗糙的tallying method,即罗列所有相近的文献,根据符合统计的差异显著性要求的研究的比例,大致确定对研究假设的论证程度。这种方法实际上人为地强化或掩盖着研究数据的趋势和形态。
出于对已有一批单独研究的结果进行再分析,以便全面和精确地总结这些研究结论的目的,20世纪70至80年代,格拉斯(G . V. Glass)提出元分析的概念,并发展了元分析的步骤和方法。元分析(meta―analysis)亦称总分析,其过程和功能,是对已有大批研究提供的统计数据的再统计分析和综合(或说分析的分析),继以探查在这批研究中每次单独研究显现不出的,而对于解决重大问题具备更高价值的结论趋势和形态。元分析作为一种统计方法,其性质属于量化研究。不过笔者认为,它是连接一批单独定量研究的个别结果和形成定性结论概括之间的一座重要桥梁:通过总分析的统计过程,实现从个别结论(即便它们之间看起来存在冲突)到一般结论的科学归纳。
元分析的方法自确立以来,在医学、社会学和心理学中得以广泛的应用,效益显著。1987年后的10年中,仅“心理学信息”(Psyc INFO)数据库中,涉及元分析关键词的研究已近2000项。在音乐心理和音乐治疗研究的英语文献中,使用元分析的研究者,仅有美国佛罗里达州立大学音乐研究中心J.M.Standley一人。这位女学者在1986年和1996年,先后发表《医学/牙科治疗中的音乐研究:元分析的临床应用》(这项研究在10年后由作者充实修订),《对用于教育/治疗目标的音乐强化效应的元分析》。由于元分析具备的“总”分析性质,应用此方法的一项研究便可覆盖数以百计的已有成果。因而,元分析的结论厚度和应用价值,必然以集中、凝炼和确切的形态大大超过这一批单独的研究本身。
这里,把与元分析相关的基本概念扼要叙述如下,并以Standley1996年有关音乐作为强化物在教育和治疗中的元分析应用为例,说明这种新的统计方法的步骤、方法和意义。
元分析之所以能够把大批单独研究给予分析和合成,是因为它使用的是一种新的度量概念――效果量(effect size,可简称ES)。效果量是在大批单独研究中的每一项研究使用的一种共同的统计单位。与传统的统计过程不同,元分析观察的是大批研究中所有效果的分布,如果某种结论趋势或形态的确存在,效果量则会集中于一个方向。
研究统计中有四个互为制约的因素:检验力,样本容量,显著性水平,以及效果量。前三个概念,是传统统计方法的使用者所熟悉的。简单地说,检验力,指统计检验能产生的显著性和拒绝某特定实验的原假设的概率。扩大样本容量,则增强检验力。显著性水平由研究者设定,它代表拒绝原假设所犯错误的概率。而效果量则是实验设计旨在探查效果的准确度量,是一种备择假设的参数。
元分析的基本步骤包括三个部分。
第一,确定研究的领域和纳入分析的已有研究的资格,据此对相应课题的研究进行全的
文献检索,并注意避免纳入分析的研究在结果和来源等方面的偏颇(例如,研究结果本身具有缺陷;不能仅仅检索已发表的文献等)。
Standley的研究,就这一步骤的界定是,纳入分析的研究:(1)是采用量化实证方法的英语文献;(2)自变量采用音乐作为行为矫正的强化依随;(3)因变量以教育和治疗为目的;(4)研究结果的形式,具备数据分析的可重复验证性。文献检索首先涉猎以下数据库:PsycInfo,PsycFirst,ERIC,Dissertation Abstracts,以及MEDLINE。然后,根据被检索研究所列资料目录再次检索。两次检索共获得该课题的100项研究,其中98项符合前述资格界定;有关因变量的效果变量达208个。
第二,确定纳入分析的有关被试特征、因变量和自变量,并对其做出描述和分类。Standley
从98项研究中归纳出正常被试和六种异常被试:智力障碍、情绪障碍、学习障碍、行为障碍、多动症和脑瘫。98项研究所含208个因变量则被分类为:学术变量、社会变量、身体康复变量、其他医疗变量、注意/交往变量、自助变量、交通行为变量、刻板行为变量、抱怨变量、作业变量和偏好变量。
第三,对有关因变量的数据进行统计,计算出标准化的效果量。不论已有研究的统计方式
如何,他们均可被转化统计为一致的效果量。其后,再根据前述确定的被试特征,对统计得出的效果量给予组织和比较,并分析和阐释其结果。
Standley的研究对208个因变量的效果量的统计,使用的是最保守的统计公式:实验组的因变量平均值减去控制组的因变量平均值,再除以控制组的标准差。在她确定的11种变量类别中,相应地得出208个效果量。按照该研究的宗旨(音乐作为依随强化物,其效果如何),这些元分析统计,在它涉及的实验条件的比较,依随音乐与其他条件的比较,强化作用,强化技术,强化程式,教育和治疗目的,被试年龄和特征等方面的结果,以及这些结果的讨论价值是引人入胜的。虽然本文的目的主要是向国内音乐心理和音乐治疗同行推荐元分析的特殊功能和方法,这里还是有必要对Standley研究的结论给予扼要的归纳,供同行参考。
总的看来,与其他非音乐的依随强化物和非依随性的音乐强化相比较,音乐作为行为矫正过程的依随强化物,其作用最为有效。它表现在能够有效地增强期望行为的频度,减低非期望行为的频度,前者较后者更为明显。从强化程式来看,音乐的程式性强化较非程式性的连续作用更为明显;另外,即时强化比延迟强化有效。音乐依随强化效果最明显的首先是身体康复和发展行为,其次是治疗和教育目的,再次是体育运动应用。
就各种不同年龄的被试而言,音乐依随强化作用,在各种年龄被试中均为显著的前提下,其最佳对象首先是成人和四岁以下婴幼儿,其他依次为5-11岁、12-14岁、15-18岁的青少年以及老年人。结合被试特征看,音乐依随强化对心理障碍和正常被试的效果优于情绪障碍或医疗和身体残疾的被试。
从分析所涉及的已有研究还可以看到,音乐依随强化的应用和效果是广泛的。在医疗中,它作用于昏迷、腹痛、啼哭、神经残疾者的颈部强度和头部体位,以及通过生物反馈治疗头痛等。在音乐依随强化研究中,应用最多的是教育领域。它能够强化正常被试班中非音乐学科的学习成就,尤其是数学和阅读,并能有效作用于音乐学习中的听辨、歌唱的音准和音乐知识及听赏的技能。在特殊教育中,它有助于正常班级对残疾儿童的接纳;增强自助能力,减缓刻板行为、破坏行为、遗尿症、习惯性反胃;增强诸如遵从教师指示、模仿和眼光交流等社会行为。在体育和运动领域,音乐依随强化能增进足球射门准确率,游泳和健身器的运动耐力。值得一提的,是心理咨询研究中有虐待倾向的父亲在音乐依随强化作用下,对其婴女啼哭的容忍增强,虐待行为减低。
正如本文第二个小标题所示,元分析的根本作用,是解决了量化实证在阐释研究结果时“见树不见林”的弊端。结合我国音乐心理和音乐治疗研究现状,元分析对我国近十多年来大批音乐治疗的个别研究在一些重要结论上的归纳,有着成熟的应用价值。
__________________________
丁东红(1957― ),女,清华大学艺术教育中心
本文发表于《中国音乐》2001年第2期)