信息可视化中的认知偏见
IEEE引用格式:E. Dimara, S. Franconeri, C. Plaisant, A. Bezerianos, and P. Dragicevic, “A Task-Based Taxonomy of Cognitive Biases for Information Visualization,” IEEE Trans. Vis. Comput. Graph., vol. 26, no. 2, pp. 1413–1432, 2020, doi: 10.1109/TVCG.2018.2872577.
文章简介
可视化设计师必须考虑三种限制:计算机的限制、显示器的限制和人的限制,对于人的限制来说,设计师必须考虑人类视觉的局限性以及人类推理的局限性。本文关注的是后者,强调人类判断和决策的缺陷
我们的判断和决定通常依赖于近似值、启发式和经验法则,即使我们没有意识到这些策略,这些策略的缺陷表现为认知偏差,虽然可视化工具是用来支持判断和决策的,但人们对认知偏见如何影响人们使用工具知之甚少,要理解可视化如何支持判断和决策,我们首先需要理解人类推理的局限性如何影响可视化数据分析
在信息可视化社区中,人们对决策和认知偏差越来越感兴趣,IEEE VIS会议已经举办了两个关于信息可视化中的认知偏差的研讨会,其他论文也承认了在视觉数据分析中研究认知偏差的重要性,尽管兴趣日益增长,但实证研究仍然有限。大多数可视化的评估不包括决策任务,而那些包含决策任务的评估通常假设人类决策是一个理性的过程,此外,证实或否定信息可视化中特定认知偏差存在的研究很少。与此同时,认知偏差研究中的大多数实验任务都使用文本表示,给出的信息由非常小的数据集组成——或者根本没有数据。因此,认知偏差和视觉数据分析之间的相互作用在很大程度上仍未被探索
本文的目标是通过对认知偏差的广泛回顾,帮助弥合认知心理学和可视化研究之间的差距,目标是信息可视化研究人员。作者根据用户的任务定义了认知偏差的分类,而不是建议对偏差产生的原因进行心理解释。这篇论文的目的是展示问题空间,促进假设的生成,并指导未来的研究,这些研究将最终帮助可视化设计者预测——甚至可能减轻——人类判断的局限性
背景知识
认知偏见
判断和决策的规范性模型假设人们遵循理性的公理,有一组固定的偏好,并做出最大化自己利益的决策。由约翰·冯提出期望效用理论制定了一套规范的规则,任何违反这些规则的决定都被认为是不合理的
Kahneman和Tversky系统性地定义了违反这些规则的证据,称之为认知偏差,例如,在一个实验中,人们会选择程序框架有33%的机会拯救生命胜与拥有66%的死亡机会,尽管两个项目是一样的,这种偏见被称为框架效应。另一个众所周知的例子是确认偏见(confirmation bias),指的是人们会寻求并偏爱能证实自己信念的信息
Pohl将认知偏见定义为一种认知现象:可靠地偏离现实,系统地发生,不自觉的发生,很难或不可能避免,并且和信息处理的正常过程截然不同
因此,认知偏见是一种认知现象,涉及到对现实的偏见,是可预测的,并且在人们之间时相对一致的,一个受认知偏见影响的人并不意识到它,并相信他们的决定,判断或记忆是公正的,偏见往往仍然存在,即使当人们被告知和训练如何克服他们
认知偏见概念的难点
认知偏见概念的一个主要难点在于判断什么构成了对”现实”的偏离,这与视觉偏见的研究形成了鲜明的对比,在视觉偏见中,现实是被物理定义的,一个人可以表明视觉客观地偏离了哪个现实,然而对认知偏见来说,现实往往难以操作化。现实通常是基于判断和决策的规范模型来定义的,但这些模型并没有被普遍接受,未来可能会出现新的规范模型,从而改变”现实”的构成。与遵循规范原则的成本相比,没有关于”错误”决策成本的完整信息,这使得决定和判断的价值难以评估,因此,认知偏见的概念在决策领域引发了长期的争论,然而,一些研究人员坚持认为,认知偏见是真实存在的,具有重要的影响,另一些人认为,在实验中产生错误的认知实际上是解决现实世界中复杂问你题的有效策略
答案可能介于两者之间:在许多情况下,鉴于人类的时间和认知资源有限,启发式和经验法则可以简化复杂的问题并产生有效的决策。然而,我们知道启发式并不总是导致最优决策,一些启发式通常会以一种系统的、可预测的方式导致偏离最优性的决策,可能会带来现实生活中的后果。因此,尽管很难定义和研究认知偏差,但认知偏差是重要的,可视化研究人员需要意识到它们
认知偏见分类
作者回顾了来自不同领域(心理学、决策系统、情报分析、可视化)的现有分类。发现大多数现有的分类都是解释性的:它们根据产生偏见的原因,通过考虑认知机制和解释性理论来组织偏见,相比之下,本文分类法是基于任务的。它根据观察到的实验任务来组织偏差,以帮助可视化研究人员识别可能影响可视化任务的偏见
作者在可视化文献中没有发现关于认知偏见的全面综述,一些研究已经开始整理和视觉分析特定方面相关的偏见,科学家们对于认知偏见的原因仍然没有达成一致,此外,在某些情况下,偏见和复杂数据处理之间预先存在的练习并不总是得到强有力的支持,虽然理解偏见的本质和来源很重要,但本文采取了更实际的方法。基于对偏差进行实验研究的论文,根据他们所观察和测量的任务对其进行分类
方法论
在标准的书目搜索之后,作者收集了偏见的初始列表,第二步是搜索最具代表性的论文,对列表中的每一种偏见进行了实证检验,第三,采用一种类似卡片分类的自下而上的分组方法对认知偏见进行分类,分类和其标签被迭代精炼,试图使它们对可视化研究人员更有用,本文对所有的偏见进行分类,并从可视化的角度审视每一个偏见:1)搜索现有的相关可视化工作(如果有的话);2)头脑风暴未来可视化研究的机会(报告在各自的类别描述)
本文提出的新的认知偏见分类是根据观察到偏见时用户所执行的任务来组织的。例如,估计心脏病发作或乳腺癌的可能性被认为是一项估计任务。在不同的健康保险政策之间进行选择是一项决策任务,造成偏见的原因可能已经被研究过(例如,错误的概率估计可能导致错误的保险选择),但是在我们对偏见的分类中忽略了这一点。本文的分类侧重于出现偏见的任务,而不是像以前那样关注为什么会出现偏见
作者决定从维基百科页面上发现的认知偏见(以及它们的同义词)开始,”认知偏见清单”-检索于2017年11月20日,总共有176中偏见,是迄今为止作者找到的最长的偏见列表,作者将其称为维基百科列表页面,这个列表的每个条目都指向一个单独的维基百科页面来描述这种偏见。尽管维基百科是发现的最大的偏见列表,但它并不是由研究人员策划的,因此接下来介绍如何验证哪些认知偏见是通过可靠的实验协议检测出来的
因为有大量的偏见,为了保持数量,每个偏见只保留一篇代表性的论文,对于这176个偏见中的每一个,采取以下过程:
在谷歌学术中输入搜索词 偏见名+信息可视化 来搜索是否在InfoVis文献中提到过偏见,作者收集了所有提及偏差的InfoVis论文,在提到偏见的可视化论文中,收集了用于描述偏见的源参考,并确定它是否是一个合格的源,作者只保留一份原始文件
当找不到一篇提到这种偏见的InfoVis论文时,或者如果这些论文没有引用一个合格的来源,我们就在维基百科的列表页面或个人维基百科页面中搜索合格的来源,如果在维基百科中没有找到合适的来源,则通过在谷歌学术中输出搜索词 偏见名+信息可视化 来搜索一个来源
当根本找不到来源时,偏见就从名单中删除
合格的源的标准:1.这是一篇同行评议的论文;2.文档可以获取;3.报告了一项人类受试者研究,以测试存在的偏见或引用了另一篇报道该研究的论文,并详细描述了论文的实验任务
对于非专业人士来说,表中的一些偏见可能看起来很相似,但作者在偏差研究者认为不同的情况下将它们分开。此外,如果两种偏差以不同的名称出现在不同的研究论文中,团队会同时保留这两种偏差,即使它们看起来很相似
为了生成基于任务的分类,首先必须确定研究偏见时使用的任务类型。然后使用开放卡片排序分析来生成类别,任务标签被分为7个类别,如图所示
每个类别都包含了相当多的偏见,因此增加了子类别
基于任务的认知偏见分类
这部分内容通过提供任务的例子来回顾每个类别,使用来自心理学研究的例子来描述偏见的子集,讨论可视化方面的相关工作,并强调可视化研究的潜在研究机会
估计任务中的偏见
在评估任务中,要求人们评估一个数量的价值。例如,在现实生活中的决策任务中,一个人可能需要估计盗窃的可能性来决定是否为自己的车投保,或者估计自己未来的退休需求来选择退休计划
在认知偏见研究中,许多评估任务需要评估某一事件在假设情况或未来发生的可能性,一些心理学实验包括一个概率估计任务,在这个任务中,正确的答案可以通过计算得到(例如,通过应用贝叶斯定理)。对真实答案的系统性偏见被认为是一种认知偏见。例如,对基础概率谬误的研究表明,人们会过分高估某一事件发生的可能性(例如,乳房x光检查结果呈阳性后患乳腺癌),因为他们往往只关注具体事件实例,而忽略了适用于一般人群的概率,有明确的事实基础的概率估计任务有助于发现其他认知偏差,如合取谬误,即人们认为特定事件比一般事件更有可能发生。此外,根据保守主义偏见的研究,人们通常不会根据新信息充分修正他们对概率的估计
一些实验涉及没有GT的概率估计任务。在这里,评价回答不是基于他们与真实答案的一致性,而是基于他们与理性的基本规范原则的一致性。例如,根据乐观偏见的实验,当人们被要求对未来的事情做出预测时(例如,找到一份理想的工作,离婚,或患肺癌),他们往往会对自己做出比别人更乐观的预测
许多实验使用的估计任务不涉及明确的概率,但有一个概率成分。频率估计就是这样一个例子。作为偏见的一个例子,人们倾向于认为以字母”R”开头的单词比以字母”R”在第三位的单词出现的频率更高,人们认为,这是因为人们使用了”可用性启发式”(availability heuristic),即以”R”开头的单词更容易从记忆中检索出来,因此被认为出现的频率更高,时间预测是”准概率”估计任务的另一个例子,因为估计未来事件的时间或持续时间与估计事件在某一时刻之前或之后发生的概率有关。有几项研究要求参与者预测完成一项任务所需的时间
(例如学术项目或任务),并将预测与实际结果进行比较,这些研究一致表明,人们倾向于过度乐观的预测,不管他们过去的经验,这种偏见被称为计划谬误
最后,一些实验显然涉及非概率估计任务,例如估计国家人口,例如,Tversky和Kahneman让参与者转一个幸运轮,然后估算联合国中非洲国家的数量,人们的回答倾向于接近幸运轮降落的数字,由于这个数字与问题没有关系,它对答案的影响强烈暗示着不合理。人们的定量估计倾向于他们最初接触到的一个值,这种倾向被称为锚定效应(anchoring effect),同时,Goldstein和Gigerenzer表明,当学生们被要求比较城市人口,他们对本国城市的判断表现得比较好(如果我从未听说过一个城市,那么它必须是小的),这个实验表明,启发式不一定会导致认知偏差,有时甚至可以产生更准确的判断
尽管评估任务在可视化任务分类中没有明确列出,但它们在可视化数据分析中无处不在,当不可能或不需要一个准确的答案时,分析任务就可能包括估计
最近的两项研究考察了锚定效应在信息可视化环境中的影响,Valdez等人给参与者一系列的散点图分类任务,并发现他们的反应收到第一张散点图的影响,Cho等人要求参与者使用视觉分析系统探索真实推特数据集,他们发现他们对于定量估算问题的回答受到锚的存在的影响,虽然Cho等人只发现锚以数字形式出现时才会产生影响,但用户日志分析表明,可视化锚会影响参与者的分析过程
Xiong等人利用一项估计任务,为可视化通信中存在的知识的诅咒提供了初步但令人信服的证据。”知识的诅咒”(The curse of knowledge)指的是人们倾向于高估自己与他人分享知识或专业技能的程度,Xiong等人的研究表明,在观看可视化图像之前,先接触文本叙事的参与者会发现与文本叙事相关的模式更为突出。至关重要的是,参与者倾向于预测,同样的模式对没有了解的观众也会很明显
除了经验性的工作,信息可视化文档已经产生了讨论可视化设计如何减轻估计偏见的文献,比如Dragicevic和Jansen列举了使用可视化和数据管理工具来减轻计划谬误的四种可能策略,而Dimara等则提出了使用可视化来减轻可用性偏见的三种方法,然而还没有开发出任何工具,也没有进行任何实验来评估这些策略的有效性
虽然自我报告的自信是信息可视化评估中常见的度量标准,但是它可能会受到偏见的影响,认知偏见研究的结果表明,信心指标需要校准,并将其置于任务准确性的背景下,即使置信度判断可以与规范统计原则兼容[70],它们也很容易受到环境的影响。先前的可视化研究表明,间接的信任评估(例如,”如果推荐系统给你另一个建议,你改变选择的可能性有多大?”)可能比直接的信心评级(例如,”你对自己的选择有多自信?”)更可靠,然而,据我们所知,以前没有可视化研究检查与性能评估相关的偏见
在这一点上,可用的经验数据太少,无法为从业者提供强有力的指导方针。一种可能的建议是,可视化应该设计为最小化获得问题答案所需的估计数量,实现这一点的一种方法是计算并可视化地将相关的汇总值呈现给用户,然而,设计签名者通常不可能预料到用户可能会对数据提出的所有问题,当用户很可能通过结合几条信息来得到不太起眼的问题的答案时,对贝叶斯估计问题的初步研究表明,将数字显示在可视化的旁边(或顶部)可能会适得其反,原因是数字会提示用户进行计算,而计算错误会产生比不完全近似更大的错误,除非需要精确的值,否则建议对所有数据进行编码量化
决策任务中的偏见
通过决策任务,作者引用任何涉及从多个备选选项中选择一个的任务。使用这种任务的心理学实验称为选择研究
当人们面对不确定性的时候,就会产生一些决策偏见,比如,在模糊效应中,人们倾向于避免与模糊结果相关的决策;或者在零风险偏见中,如果一组选择中包含一个完全消除风险的替代选项,即使这不是最优决策,他们也会坚持下去。人们还常常根据问题是受益还是损失,或者简单地被定义为受益或损失,即框架效应,显示不同的偏好
然而,并非所有的决策偏差都与不确定的结果或框架有关。当人们做出这样或那样的选择时,他们常常会无意识地受到与所做决定无关的因素的影响。在大多数情况下,决策者不是孤立地评估备选方案,而是在备选方案出现的上下文中进行评估。一个被充分研究的例子是吸引力效应,即一个人在两个选择之间的决定会受到不相关(低劣)选择的存在的影响
某些偏见,比如越少越好效果(less is better effect),人们的决定会受到选择项是单独出现还是并列出现的影响,或者这些选择是否在更极端的选择中出现(妥协效应),或不可用的选项(幻影效应),或更熟悉的替代品(刚接触效应)
其他的认知偏见指的是那些看起来更容易被能够立即得到奖励的选择所吸引的人,比如双曲线折扣,或者他们之前投入了自我努力,比如宜家效应。例子还包括对人们过去拥有的替代品的吸引力(禀赋效应),或者避免做出任何需要改变当前状态的决定(现状偏见)
Dimara等人发现散点图在可视化中存在在吸引效应,并证实即使数据被正确地可视化和理解,决策也可能是不理性的,最近的研究表明,可视化可以通过允许用户从显示中删除不应该影响理性决策过程的信息来缓解吸引效应,Zhang等人进一步表明,采用静态表格可视化星级评级的初创公司往往容易受到损失厌恶倾向的影响
另一个在可视化背景下研究的决策偏见的例子是可识别的受害者效应,与大量抽象或统计描述的人相比,人们更倾向于帮助一个被具体描述的需要帮助的人。相比之下,Boy等人发现,使用类似具体的拟人化图标的数据图形不会增加用户对弱势群体的同情。这一结果表明,将认知偏差的发现与可视化设计结合起来,很难预测结果
视觉化也可以用来寻找认知偏见的证据。这种决定偏见的一个例子是在政府选举中。有几项科学研究对候选人在选票上的顺序会影响选举结果这一假设进行了很长时间的调查,但它们只找到了非决定性的证据,有研究收集了2010年5月6日举行的大伦敦地区地方选举的5000名候选人的数据,使用分层空间排列的可视化方法对他们进行了分析,结果表明候选人名字在选票上的位置确实影响了他们获得的选票数量。Wood等人的视觉分析技术表明,候选人按字母顺序的表格表示可能导致选举结果有偏见
虽然决策偏见对于以支持决策为目标的可视化系统来说是至关重要的,但大多数决策支持可视化很少评估用户决策的质量
假设评估任务中的偏见
假设评估任务指的是调查一个或多个假设是否正确的任务。这里的”假设”一词并不一定指正式的统计假设,而是指任何非正式的或正式的、可以用以前的或新的知识加以证实或否定的陈述,作者确定了11种假设评估偏见
最具影响力的偏见之一就是确认偏见,人们在潜意识中忽略否定证据的同时证实最初假设的证据,这一类别的相关偏见是”虚假真理效应”,即人们在反复接触某一命题后,认为该命题为真;一致性偏见,即人们在检验一个假设是否正确时不考虑其他假设;以及当人们考虑不存在的变量之间的关系时产生的错觉相关偏见
科学家自己在假设评估中也会受到偏见的影响。例如,根据对”前围观者效应”的研究,实验者可以潜意识地影响参与者,使他们的行为符合他们的实验心理假设
假设评估任务在使用可视化工具进行数据分析和推理中很常见,例如探索卡车是否比普通汽车发生更多事故;是否一辆汽车的马力与其重量相关;或者地球温度是否在上升。Keim等人将这种类型的高级任务称为验证性分析,Amar和Stasko在他们的分类中将其定义为确认假设任务
虽然假设评估偏见被认为是信息可视化的关键挑战,但我们不知道有任何实证研究试图对其进行评估。自然的第一步应该是通过经验来确认,在使用可视化时,假设评估偏见确实会发生
为了减轻确认偏见,心理学文献中提出了几种策略,包括”竞争假说分析”和”证据整理”,这些方法分别鼓励分析师产生多个假设,并在得到任何结论之前仔细记录证实或拒绝每一个假设的证据,一些软件工具帮助用户遵循这些方法,方便记录和证据与假设的联系,这些方法可能会减轻这一类别中的其它偏见,为研究开辟新的机会
作为可视化设计师,我们可以考虑其他可能的设计特征作为可能的方法来减轻假设评估偏见。例如,我们可以研究是否可以通过显示哪些数据已经在我们的视觉化中被检查过,哪些被忽略,来减少可信度和其他相关偏见,或者当我们建议或要求在我们的工具中遵循特定的分析工作流时,它们是否可以被减少。虽然我们努力给所有的展示贴上清晰的标签,但在某些情况下,暂时隐藏标签可以通过模拟一种”盲测”的情况来减少假设评估的偏见,例如,考虑一位分析人员检查有关犯罪的证据或输入基于种族的统计数据。如果在最初审查收入或犯罪数据时,可视化显示的是简单的标签(如A、B和C),而不是实际的种族值,那么它可以删除可能的种族偏见,使得分析师考虑他们所掌握的所有证据
除了确定测试这些偏见的机会并以可视化的方式减轻它们之外,我们还希望提高对我们社区中存在的假设评估偏见的意识,因为作为研究人员,我们可能容易产生这些偏见。我们希望这种认识将有助于可视化研究人员采用更稳健的方法来应对这些偏见
因果归因任务中的偏见
因果归因任务指的是任何涉及因果关系评估的任务,在社会心理学中,归因理论研究人们如何解释行为和事件的原因,例如,在解释一个事件时,人们可以将事件归因于外部因素(例如,John出了车祸,因为路况不好),也可以归因于内部因素(例如,John出了车祸,因为他不是一个好司机),这个类别下作者一共总结了12种偏见
归因偏见主要是在社会心理学中研究的,所以实验场景通常集中在对人类行为的判断上。它们揭示了人们在给出解释时倾向于偏爱自己,例如,自我中心偏见表明,当被要求解释为什么一个共同的成就是成功的时,人们倾向于高估自己的贡献,同样,这种自我服务的偏见表明,人们倾向于把成功归因于自己的能力和努力,而把失败归因于外部因素,例如,一个学生可以把好的考试成绩归功于自己的努力,而把不好的成绩归功于外部因素,比如老师的素质太差或者考试中的问题不公平,当谈到失败时,根据”行动者-观察者偏见”,人们倾向于将自己的失败归因于情境因素,而将他人的失败归因于个性弱点,例如,他们更可能把交通事故归咎于糟糕的路况或其他司机,而把其他人的交通事故归咎于他们糟糕的驾驶技术。人们有时也倾向于将他人模棱两可的行为归因于故意的负面原因,例如,我看到我的同伴在笑,他们可能是在笑我
归因偏差不仅发生在人们不公正地评价自己的行为和他人的行为时,也发生在群体成员(内群体成员)对外部群体成员(外群体成员)的行为,在判断外群体成员的行为时,人们也倾向于对个体的行为进行过度概括。例如,在群体归因错误中,人们倾向于将群体做出的决定泛化到个体身上
因果归因任务在使用可视化时也很常见。Amar和Stasko将这些任务明确标识为在其分类中表示因果关系的任务。原则上,任何分析任务都可以涉及因果归因,当用户在探索数据时试图解释现象为什么会发生,比如试图解释峰值或异常值。例如,当分析师试图确定”为什么美国的大规模杀戮比其他国家更多?”或者”是什么原因导致了法国最近交通事故死亡人数的下降?”
数据分析活动包括描述数据中的模式,但也包括根据这些模式制定决定性步骤,通常依赖于用户的内部因果模型,即哪些因素会影响数据中的哪些结果。已有一些可视化工具可以帮助进行此类分析(如因果分析图),但还需要对其有效性进行进一步研究
尽管因果归因偏差还没有成为可视化领域大量研究的主题,但该领域的研究潜力已经成熟。过去的研究发现,分析师基于相关性的存在得出了错误的因果结论。例如,当观察到激素替代疗法(HRT)患者的非典型心脏病发病率也低于平均水平时,医生建议HRT预防听力疾病;后来的一项分析表明,更有可能的是,因为激素替代疗法的患者来自社会经济地位较高的群体,当存在相关性时,研究可视化设计可能会减少错误的因果归因,这可能是富有成效的
另一个可能的研究方向来自一个有趣的数据,仪表盘用户更有可能从可视化数据中做出没有根据的因果声明。一份图表显示,使用新GPS系统的司机发生事故(每年1%)比使用旧系统的司机(每年2%)多,观察者很可能错误地认为新GPS设备导致更多事故,为了得出正确的结论,查看者必须考虑预先存在的驾驶员行为。在这种情况下,大多数安全的司机没有使用新的系统。决定使用新的GPS系统的大多是那些冒险的司机(无论如何,他们往往会发生更多的事故),因此增加了新系统的事故数量,事实上,当单独考虑时,新系统提高了两类驾驶员的安全性。收集经验数据来证明这类潜在的关键性错误的存在是很重要的,这些错误源于选择可视化的数据组合
错误的因果归因的另一个副作用是人们不能正确地监控共同行动的结果或低估了他人的贡献,然而,有效的协同工作在视觉数据分析中是必不可少的,例如,当多个调查人员监控不同的可疑个体时,一个危险的情况在实时发展。如果添加展示同事活动的可视化效果,是否能促进对他人工作的更平衡的欣赏,这将是一个有趣的研究
回忆任务中的偏见
记忆不是对过去经历的复制,而是在回忆的时候重建的,这意味着事件后的信息可以改变记忆,这被称为错误信息效应。更普遍的是,人们倾向于更好的回忆,人们还会把别人的想法误认为是原创的,这可能是剽窃的一个潜在原因,相反,人们将一些虚构事件视为真实,这是在对犯罪证人进行采访时,经过误导的暗示后经常看到的现象
从理论上讲,通过对所有相关信息无偏见地补充记忆,使用可视化可以帮助观众克服有限的(和有偏见的)记忆回忆过程。但在复杂的数据集中,并不是所有的信息都能被显示,即使可以,也不可能全部被查看者处理。此外,观看者仍将依赖一个有限的、有偏见的记忆系统来将观看的数据点与例子、上下文和情绪联系起来。所以视觉化能够减少,但不能消除,有偏见的回忆过程,这个问题的一个解决方案可能是注释系统,它引导观察者记录对已查看数据子集的观察和判断,然后组织并提供用户偏好的自动比较
可视化的一些特性可以使它们更容易记住。包括真实世界的图像或物体或不同于其他人的视觉化可以引导参与者更好地回忆他们看到的那些视觉化。一些工作正在开始另外显示记忆可以改善在可视化中描绘的数据模式,将传统的柱状图转换成一堆物体的图标图片(例如,将一些棒球比赛描述成一堆棒球)可以提高对所描述信息的短期记忆。将数据模式链接到真实的对象可以提升模式的长期记忆,一个为数据形状助记提供建议的自动化系统可以增强人类有限的记忆力
观点报告任务中的偏见
尽管参与者的观点在许多其他偏见类别中扮演着重要角色,但在观点转证类别中,任务是明确地报告这个观点(例如,美国人很聪明)。相比之下,在因果归因类别中,任务是解释一种现象(例如,美国人享受经济增长是因为美国人聪明),在假设评估类别中,目标是调查一个陈述是对的还是错的(例如,根据这些数据,即美国的智商分数,文章,事实,美国人聪明吗?)在估计类别中,目标是评估一个数量或预测一个结果(例如,美国可能会增长,因为美国人很聪明),观点报道的偏见不同于其他类别,因为有某些信念的人不一定会基于这些信念来推理或预测未来
根据从众效应,人们对堕胎等问题的信仰可以根据多数人的观点而改变。然而,人们往往认为,与自己相比,他人更有偏见(天真的犬儒主义),更容易受到大众媒体宣传(第三人称效应)。人们还倾向于将某个群体成员的某些特征(如种族、民族、性别、年龄)归纳到整个群体,而往往忽略相互矛盾的证据(刻板印象)。最后,人们倾向于根据结果而不是行为来承担道德责任(道德)
意见报告这一类别本质上与人们的态度、道德信念和行为有关,而不是在一般性分析任务中观察到的偏见,这对可视化研究人员可能没有太大用处。然而,类似于所有其他偏见类别,这些错误与可视化系统的可能联系是一个未探索的话题,特别是当它涉及到减轻偏见
其它偏见
最后一个类别包括所有的系统偏见,这些偏见是通过实验观察到的,与前面讨论的任何任务都无关
这一类别的一些偏见涉及观察行为而不是评估反应。例如,根据单位偏见,人们倾向于在较大的邻域吃更多的食物,投资者倾向于当投资表现出负面信息时,减少对其投资组合的监控(鸵鸟效应),一旦人们的安全意识增强,他们也会倾向于发展更危险的行为,例如,开一辆安全气囊更好的车会开得更快。(风险补偿)
尽管这些偏见并不局限于特定的任务类别,但它们可能与可视化设计有关,例如,单位偏见可能与数量的视觉判断有关,例如,由于轴缩放的选择,散点点周围增加的空白可能会影响对有多少数据点的判断,鸵鸟效应与人们可能淡化或忽略浏览者认为是负面的信息的数据或分析显示有关,这表明自动化系统可以突出这些信息来抵消这种偏见,当查看者考虑如何为显示在视图中的数据值设置阈值,并根据有关其他参数的新但不相关的信息更改阈值时,可能会出现类似于风险补偿的偏差
讨论
基于任务分类的好处
本文提出的分类法是按照任务来组织的,而以前的分类法是基于经常未经测试的、难以理解的、甚至是矛盾的对认知偏见产生原因的解释。我们相信,这种组织将使可视化研究人员更容易发现哪些偏见可能与他们的系统或研究领域相关。它假设已经进行了任务分析(这是一个标准的用户界面设计实践),而不是要求视觉化研究人员猜测用户可能必须遵循的内部认知过程
最后,我们的分类保留了指向原始实验的指针,这可以帮助可视化研究人员使用在其他领域已经建立的方法进行新的评估
很可能将来会发现更多的偏见,而偏见的列表将不得不进一步扩大。据我们所知,这一分类是迄今为止文献中最大的,包括在不同研究领域(如心理学、消费者研究、社会学)研究的偏见
可视化任务
作者通过对用于检测这些偏见的实验任务的分析,得出了偏见的类别。因此,这些分类捕获的任务不一定与可视化分类中描述的可视化任务保持一致,此类任务通常是较低级别的任务,但可以作为分类法中许多较高级任务的构建块,然而,正如在类别中看到的,本文的一些任务确实与可视化分类共享,例如假设评估或因果公式,然而,所确定的所有任务都与可视化系统和研究的目标高度相关。例如,决策支持系统的用户经常必须做出选择,而决策类别揭示了偏见,当用户执行这些任务时,偏见可能是一个因素,同样,对可视化设计的可记忆性感兴趣的可视化研究人员可以关注回忆偏见。研究验证性分析任务的研究人员可以从假设评估类别开始,而研究不确定性可视化的研究人员可能需要关注估计类别
未来研究的机会
目前关于视觉认知偏见的研究很少,这为未来的可视化研究提供了很多机会。研究人员可以从附录表中提供的丰富的认知偏见集合中选择一个偏见,测试当提供标准的可视化图像时,偏见是否仍然存在,如果是,研究是否可以通过使用改进的设计来减轻偏见
在信息可视化的背景下研究认知偏见也为扩展心理学的方法和结果提供了机会。例如,吸引力效应是一种决策偏见,在数值表中只能用三种改变来定义。在一项可视化研究中,Dimara等人将吸引力效应的定义扩展到三种以上的选择,并提出了构建刺激数据集的程序
心理学文献经常提出缓解偏见的方法,其中一些策略可以应用于可视化实验。由于缓解策略是有偏向性的,本文不可能全部涵盖,每种偏见都需要自己的文献调查。作者希望本文的分类法将通过提供参考作为起点来促进这类调查
局限性
偏见是很多的,但很可能会发现更多的偏见。虽然所有的偏差都在附录表中列出和分类,但本文本身只能讨论偏见的一个子集。我们把讨论的重点放在那些对形象化最重要、在心理学中最完善、最反映了理性违背的偏见上
此外,每一种偏见都被划分为一个类别。在不同的研究中,同样的认知偏见可能存在于不止一种任务类型中,尽管大多数学术研究倾向于不断重复同样的任务,这种担忧确实是一种可能,但不一定是一种限制。分类法背后的假设是,研究人员应该以不同的方式处理不同的用户任务,关于吸引效应的文献中有一个很好的例子,在两个不同的任务中观察到同样的偏见。吸引效应作为一项决策任务在三种商业产品中被大量复制,有一些论文测试了视觉判断任务中的吸引力效应,如识别两个矩形中哪个更大或寻找圆和线对的相似性,尽管这些情况看起来与吸引效应相似,也可能有相似的根源,但最好是把它们当作感知偏见来对待,因为人们通常无法对物体的视觉属性进行编码
而且,最初的编码和排序是由一个人进行的。这可以通过包含所有五个作者的多次审查和迭代过程来缓解。为了使总引用的数量可控,对具有代表性的论文的搜索在满足来源资格要求的第一个部分停止,而不是彻底的搜索。本文的分类是一个起点,但是要深入研究特定的偏见,需要单独的文献综述
最后,根据定义,认知偏见假定”脱离现实”,这是一个复杂而有争议的概念。我们仍然没有确凿的证据证明已知的认知偏见实际上反映了非理性。因此,InfoVis研究者应该尝试在他们的研究中验证错误反应确实反映了不合理性,而不是基于任务的替代解释某种最佳策略。我们也鼓励可视化研究人员对当前围绕非理性概念的认知偏见研究的争论保持更新
结论
这篇论文分类了154种认知偏差,即人们系统地、非自愿地偏离预期的理性“现实”的情况。例如,他们的决定往往受到与决策方案的可预见品质无关的原因的影响。本文的分类是基于任务的(偏差是什么时候出现的),而不是解释的(为什么会出现),以帮助可视化研究人员识别可能影响他们的可视化任务的偏差
在视觉化文献中,认知偏见经常被认为是重要的。一些研究确实在视觉化的背景下讨论了认知偏差,但是他们没有提供在使用视觉化时检测或减轻偏见的证据。在本文的综述中,只发现了一项实证研究,该研究利用可视化设计减轻了认知偏差。更普遍的是,似乎很少有可视化研究为可视化中存在的认知偏见提供证据。这个空间为可视化的研究提供了充足的机会,并且作者希望本文在不同的偏见类别中提出的方向能够启发未来的工作