http://copsy.org/hehe/
rss
  • 关于
  • 迷路了
  • 雁过留痕

几个用户才够,这不是问题?

no comments
Feb 20 2012 用户体验研究

大家都知道那个”神奇的数字5“,因为Nielsen的研究发现,5个用户可以发现80%以上的可用性问题,他是假设平均每个用户可以发现30%的可用性问题,而且假设所有问题都有同等被发现的概率。

过去的研究已经对测试的样本大小进行过不少探讨,例如:

  • Benefits of increased sample sizes in usability testing (2003)
  • Why you only need to test with 5 users (2000)
  • Five users is nowhere near enough (2001)
  • Refining the test phase of usability evaluation: How many subjects is enough? (1992)
 
Lindgaard和Chattratichart(2007)的研究发现,可用性测试的用户数量与被发现的可用性问题比例、被发现的新可用性问题比例均不存在显著的相关关系。但是用户的差异化、任务的个数则与被发现的可用性问题显著相关。(详见下面的PPT)
 
Lindgaard和Chattratichart说,HCI在过去15年花了较多的时间去探讨用户的数量,而忽略了如何设计可用性测试中的任务
 
其实,在用户招募阶段,比用户数量更需要重视是用户的代表性的问题。能否招募到有代表性的用户将直接影响可用性测试的成败。
 
 
Take-home Message:
  1. 尽量选取有代表性的用户,而且用户不要太同质化(如果我没记错的话,统计上也是如此,用户内部的差异越大,才容易检测出显著)
  2. 任务的数量可以多一点(但也不能太多,那具体几个好呢?没仔细看),任务涉及的功能点广才能测试出更多的可用性问题。”如果产品处在设计的初期,我们需要关注一些宏大的问题(如:网站的整体架构、导航和分类的合理性、页面的逻辑关系),此时就需要通过宽泛而有弹性的任务,来查找宏观层面的问题。如果产品的设计已经非常完善,开始进行细节的修改迭代,此时就需要通过设置相对具体的任务来查找特定的细节问题(如:对某个命名的理解、按钮的使用、链接的点击、表单的填写)。“  (摘自网易用研)
 
Usability testing:what have we overlooked

 

参考文献:

Lindgaard, G., & Chattratichart, J. (2007). Usability testing: what have we overlooked? Proceedings of the SIGCHI Conference on Human factors in Computing Systems, 1415-1424. [PDF下载]
网易:可用性测试的权衡之道(一)  

 


做用研时思考过的一些问题

no comments
Feb 19 2012 用户体验研究

领了2次工资,写点东西小结一下吧….

 

作为心理系的学生,第一次接触可用性测试的时候,我感觉:

1)“脚本”这个词很怪

2)人真的是千奇百怪,面对同样一样东西,人与人的反应差异很大

3)为什么实验的主试要和被试一对一地交流,而不像很多心理学的实验那样,直接让被试对着屏幕来完成,减少主试对被试的干预。由于我们经常要计算用户完成任务的时间、成功率,而用户在完成这些任务时会询问主试问题等,这使得计算任务完成的时间存在困难,而且由于主试在场的话,被试是否会存在依赖心理,凡是遇到不太理解的地方都会问主试,这样可能也会降低任务的成功率和独立性的评分。

4)为什么被试数目这么少?12-30个真的够吗?虽说找被试很贵,但调研公司做个普通的调查需要几百个样本,岂不是更贵?而且“5个用户可以发现85%以上的可用性”,这个85%也是基于每个用户可能发现所有问题的30%而计算出来的(关于这个问题的讨论详看这里)。

5)企业内部的用研部门 vs 请外面的咨询公司

 

read more


系统可用性量表(System Usability Scale, SUS)

no comments
Feb 14 2012 用户体验研究

可用性量表很多(见下图),SUS只是其中一个。 

SUS简介:

量表作者:John Brooke  (Digital Equipment Corporation, UK, 1986)

问卷组成:10个问题,在5点量表上打分

量表中文版以及计分方式:查看这里

信度:0.85  (见上图)

 

优点:

  • 问卷短,省时
  • 最后会得出一个分数,直观
  • 免费
  • 对于小样本( n<14),SUS的优势更明显(见下图),图中的意思:随即抽取14名被试的SUS问卷均能判断网站1比网站2要好,而抽取的CSUQ问卷只有90%能做出这个正确的判断,详见这个PPT或原论文)

read more


搞学术,就像炒股,热的时候才买进就已经迟了

no comments
Jul 6 2011 小笔记


首先声明,

1)我不是学心理学史的,对以下提到的名词概念也不求甚解,不要把我的理解当作就是该概念的定义;

2)下图中名词之间没有必然的历史先后顺序

3)下图没有试图把所有的流派和理论都来一个梳理,我只是喜欢说哪个,就把哪个东西加进去,所以是很片面的。

    不过,它确实是我思考所留下的一些笔记,也算是我对所知的心理学理论的一个整理,仅供有耐心读完的童鞋阅读。

      除了心理学史的教材上,对各种心理学流派的区分之外,我觉得不同流派的背后,是否对人有着某些更本质的看法。下面主要谈3种:一种把人当动物看,一种把人当机器看,一种是把人当外壳看。

      弗洛伊德被迟毓凯老师戏称是“老流氓”,“山川河岳都能想像成生殖器弗洛伊德”。在弗洛伊德眼里,“人无异于禽兽”,只是被超我驯服着,人本质上受“性”欲(libido)所驱使;荣格所说的集体潜意识,是几千年来人类世世代代的经验库在我们大脑中的痕迹;Richard Dawkins所说的迷因(meme),是DNA的一个类比,意指文化的遗传因子,(它虽然不像DNA那样是个物理实体,)但它会像生物演化那样,具有复制、变异与选择的演化过程;而进化心理学则把生物进化的观点继续推进,认为不仅我们的身体(physical body)在演化,就连我们的认知过程、行为也体现出演化的痕迹,我们之所以喜欢甜食、男生之所以喜欢漂亮的女生等心理和行为,本质上都是都是为了更好地繁衍成功。

      把这几个概念同时呈现的时候,我在想,它们似乎都有些共同点:都谈到遗传/繁殖,都谈到了认知模式具有可遗传性,它深深扎根在我们的大脑里,在无意识地影响着我们的行为,并一代代复演着。而被我搁在一边的华生,在他眼里,我们其实就是巴甫洛夫的那条狗,刺激-反应的条件反射就是我们的行为模式。以上几种观点,本质上就是把人“退化”到动物的这个身份来思考,看看动物身上具有什么特点,然后把它推广到人身上。

 

read more


心理咨询的10个“谣言”

no comments
Jul 4 2011 读Paper

文字版

  • 发泄负面的情绪(e.g.生气),可以让它减少,但实际正好相反(Bushman, Bonacci, Pedersen, Vasquez, & MIller, 2005; Tavris, 1989)
  • 人们经常提到分离性身份障碍(disscociateive identity disorder)即多重人格这个词,但现实是有多重人格的人是极其少,更多只是出现在电影中(Lilienfeld & Lynn, 2003; Piper & Merskey, 2004; rieber ,2006)
  • 有人将小孩是否对逼真的解剖娃娃(anatomically realistic doll)作为判断孩子是否遭到虐待的可靠参考,但发现并非如此 (Bruck, Cecil, Francoeur & Renick, 1995; Hunsley, Lee, & Wood, 2003, Koocher, Goddman, White, & Friedrich, 1995; 

Wood, Nezworski, Lilienfeld, & Gard, 2003)

  • 大部分遭受虐待孩子,其父母在年少时也遭受虐待,陷入“虐待的轮回”,而现实中大部分情况并非如此(Kaufman & Zigler, 1987)
  • 在调查孩子是否遭到性虐待时,我们会以为小孩子应该不会对这种事情撒谎或错误记忆,但现实是他们其实是会的,尤其是当审问他们的成年人已经存有观念认为他们确实遭受过虐待(Bruck, 2003; Ceci & Brcuk, 1995; Garven, Wood, Malpass, & Shaw, 1998)
  • 在儿童或成年时遭受过创伤的人,经常压抑这些记忆,但现实情况通常是因为人们无法去忘记这些记忆(Loftus & Ketcham, 1994, McNally, 2003)
  • 在评估儿童监护权时,人们会使用投射性测试,但现实是这些测试是无用的(Emery, Otto, & O'Donohue, 2005)
  • 人们认为,催眠是提取过去记忆的一种有效方式,甚至能记起孩童时的记忆,而现实情况是催眠更容易产生虚构和虚假记忆(Dinges,  Whitehouse, Orene, Powell, Orne et al. ,1992; Kihlstrom, 1994; Nash, 1987)
  • 认为自尊(self-esteem)是所有社会和个人问题的根源,这些问题包括学业成绩、吸毒、青年犯罪,而数百个研究发现,这个观点没能找到信服性的证据(Baumeister, Campbell, Krueger, & Vohs, 2003)
  • 以为紧急事件应激晤谈(Critical Incident Stress Debriefing, CISD)可以避免遭受了这些重大事件/灾祸的人,产生创伤后应激障碍(posttraumatic stress disorder, PTSD),而事实发现它是无效的,或会增加PTSD的可能(Gist, Lubin, & Redburn, 1998; Mayou, Ehlers, & Hobbs, 2000; van Emmerik, Kamphuis, Hulsbosch, & Emelkamp, 2002; van Ommeren, Saxena, & Saraceno, 2005)

 

摘自Carole Wade. (2009) Chapter 2. Critical Thinking: Needed Now More Than Ever. 

【为避免谬种流传,成为第11条谣言,请看完下面的图】….谢谢@沉默的马大爷 请来各位专业人士…谢谢@边缘立夏

read more


APA对心理学学科教育的纲领

no comments
Jul 3 2011 留学在美国

 

从高中到本科、再到研究生入学考试,了解一下美国对心理学的学科指导纲领。(以后看完后再介绍)
 
1)National Standards for High School Psychology Curricula  
       在线阅读;PDF下载
2)APA Guidelines for the Undergraduate Psychology Major
       PDF下载
3)美国研究生入学考试GRE Psychology subject
     有兴趣的同学可以下载这个文件,自己做题目试试
 

GRE心理学考试大纲及试卷组成

 

GRE 心理学考试大纲及试卷组成(中文翻译)

1.实验或自然科学导向的题目(约占题目总数的40%)

     包括学习,语言,记忆,思考,知觉和感觉,生理心理学,动物行为学和比较心理学。这部分得分记入实验心理学的子分数,也将记入测试的总分数。

2.社会或社会科学导向的题目(约占题目总数的43%)。

     这些题目分布在临床心理学,变态心理学,发展心理学,人格心理学和社会心理学中。这部分的得分将记入社会心理学的子分数中,也将记入总分。

3.综合题目(约占题目总数的17%)

   包括心理学史,应用心理学,测量,实验设计,以及统计。这部分的分数只记入总分。     属于不同子分数范围的题目将贯穿于整个测试中,并没有分开并分别标识出,尽管有些从一个个别的学科内容提出的问题会连续出现。

 

GRE 心理学考试大纲及试卷组成(英文原文)

I. EXPERIMENTAL SUBSCORE — 40%

· Learning (3–5%)

o Classical Conditioning

o Instrumental Conditioning

o Observational Learning, Modeling

o Theories, Applications and Issues

        

· Language (3–4%)

o Units (phonemes, morphemes, phrases)

o Syntax

o Meaning

o Speech Perception and Processing

o Verbal and Nonverbal Communication

o Bilingualism

o Theories, Applications and Issues

        

· Memory (7–9%)

o Working Memory

o Long-term Memory

o Types of Memory

o Memory Systems and Processes

o Theories, Applications and Issues

        

· Thinking (4–6%)

o Representation (Categorization, Imagery, Schemas, Scripts)

o Problem Solving

o Judgment and Decision-Making Processes

o Planning, Metacognition

o Intelligence

o Theories, Applications and Issues

        

· Sensation and Perception (5–7%)

o Psychophysics, Signal Detection

o Attention

o Perceptual Organization

o Vision

o Audition

o Gustation

o Olfaction

o Somatosenses

o Vestibular and Kinesthetic Senses

o Theories, Applications and Issues

        

· Physiological/Behavioral Neuroscience (12–14%)

o Neurons

o Sensory Structures and Processes

o Motor Structures and Functions

o Central Structures and Processes

o Motivation, Arousal, Emotion

o Cognitive Neuroscience

o Neuromodulators and Drugs

o Hormonal Factors

o Comparative and Ethology

o States of Consciousness

o Theories, Applications and Issues

        

II. SOCIAL SUBSCORE — 43%

· Clinical and Abnormal (12–14%)

o Stress, Conflict, Coping

o Diagnostic Systems

o Assessment

o Causes and Development of Disorders

o Neurophysiological Factors

o Treatment of Disorders

o Epidemiology

o Prevention

o Health Psychology

o Theories, Applications and Issues

        

· Lifespan Development (12–14%)

o Nature-Nurture

o Physical and Motor

o Perception and Cognition

o Language

o Intelligence

o Social and Personality

o Emotion

o Socialization, Family and Cultural Influences

o Theories, Applications and Issues

        

· Personality (3–5%)

o Theories

o Structure

o Assessment

o Personality and Behavior

o Applications and Issues

        

· Social (12–14%)

o Social Perception, Cognition, Attribution, Beliefs

o Attitudes and Behavior

o Social Comparison, Self

o Emotion, Affect and Motivation

o Conformity, Influence and Persuasion

o Interpersonal Attraction and Close Relationships

o Group and Intergroup Processes

o Cultural and Gender Influences

o Evolutionary Psychology, Altruism and Aggression

o Theories, Applications and Issues

        

III. OTHER AREAS — 17%

· General (4–6%)

o History

o Industrial-Organizational

o Educational

        

· Measurement and Methodology (11–13%)

o Psychometrics, Test Construction, Reliability, Validity

o Research Designs

o Statistical Procedures

o Scientific Method and the Evaluation of Evidence

o Ethics and Legal Issues

o Analysis and Interpretation of Findings


你有压力,我有压力——聊聊美国的IRB申请经历

no comments
Jun 29 2011 留学在美国


    
 

     没有最烦,只有更烦。

     这句话概括了这次申请IRB的过程。在美国,用人做实验的被试都要经过IRB(institutional review board)的审批。(别说是人,老鼠也是一样。幸亏我不是研究脑科学,如果是做PET的实验,估计没几个月批不下来)

     尽管烦人,不过还是学到不少在实验过程中,需要注意的细节:

1)轻易不要改动实验过程。凡是要改,都得提交amendment,估计又得等几天。像我这样的无风险实验,从提交到最后审批用了1个半月。

2)你是通过什么方法招到这些被试,他们为什么愿意参加这个实验,你是不是用了硬性的(强迫)手段?尤其是,如果你是老师,直接在自己班里施测,如果学生不参加,会不会影响他们这门课的成绩。(甚至像我的proposal里,计划在上完一节课之后实测,IRB的人就帮我改成,实验人员在准备施测的时候,老师必须离开课室,以防老师看到哪些童鞋没有参加实验,影响到老师对学生的印象;然后在报告里,添加了一个说明,说实验中的得分高低,只适用于实验本身,不会影响学生的期末成绩)

3)consent form签了之后,还得封存2年(还是3年?忘了)。问卷或数据回收之后,得保管好,尤其是电脑中的数据,要防止其他人打开来看;若实验要求填写任何个人信息,你怎么对这些信息进行保密,你的信息录入电脑之后(和进行必要的数据分析、得出实验所需的结果之后),一般要将数据里的个人信息替换,e.g.填写的人名Brian House换成BH。而对原有的问卷,需要用黑色的笔涂掉或者用东西遮住被试的个人信息,无法在追认出原作者。

4)理论上说,对所有接触到问卷、参与数据录入和分析的实验人员都得经过培训,知道如何对数据中所涉及的任何个人信息进行严格地保密。e.g.如果你进行实验数据的传输,或者是通过网页在线收集数据,或者在email通信时发送了这类信息,你是否能保证这些信息没有泄露。避免“艳照门”。


     由于当时得在3个月内赶完毕业论文,心里着急,想她快点批。不过,现在想来,让我想起了那个巴士阿叔的对白

     “你有压力,我有压力”



When Words Hurts——言语遮蔽效应(verbal overshadowing)

no comments
Jun 28 2011 读Paper

    世界真是小。

    verbal shadowing是在去年本科的系主任告诉我她正在做的一个课题,当时看了一下有关的文献,写了下面的总结。不过,当时不是很想做记忆方面的研究了,所以看完之后就不了了之了。

    没想到,今天看哈佛的一个讲座时,再次提到了Dr. Schooler,才知道他是个大牛。(跟下面的那篇诺布效应一样)

人们通常认为,对外部刺激事件的言语描述有助于记忆。但是,在下面的实验中,言语描述反而导致记忆效果更差,即出现言语遮蔽或译为语词遮蔽(verbal overshadowing)

 

经典实验

Schooler 和 Engstler-Schooler(1990)让被试观看一个长30 秒的描述银行抢劫的录像片,随后是20 分钟的分心任务,要求阅读几个短文,并回答与之有关的问题。接着把被试分成两组,分别接受不同的处理。

A组:用5分钟写下对抢劫者面貌的详细描述;

B组:用5分钟阅读一些无关的文字。

结果发现,A组指认罪犯的准确率为 38%,B组准确率却为 64%。

 

Meissner and Brigham在2001年对做的一个统合分析(meta-analysis),发现语词遮蔽效应显著,效应大小(effect size)不强,Fish's Zr=.12。过去的研究也发现,这一效应有时候会不显著、没有、甚至相反,即言语描述增强了记忆效果。(Fallshore & Schooler, 1995; Melcher & Schooler, 1996; Schooler, Ryan, & Reder, 1996). 

read more


宁相信人是邪恶,也不相信人是善良的—诺布效应(Knobe effect)

no comments
Jun 28 2011 读Paper

  

      这是去年看的文章,后来在Edge上再一次看到的时候,才知道提出Knobe效应的是Yale的教授(见下图)。他里面提到的一个实验的题材,正是去年红火的哈佛公正课第一节课提到的例子——那个电车撞人的道德困境。

我们有意做出某一行为,它附带产生了无意的后果,我们也预见到了这种后果的产生。有趣的是,我们在判断这一附带产生的后果是否是有意作出的时候,存在在不对称性:如果这个后果是正面的,人们倾向于判断它是无意产生的;相反,如果是负面的,人们则倾向于判断它是有意产生的。这一效应最早由Knobe在 2003年提出。

4岁的儿童中就开始出现这种不对称的判断(leslie, Knob & Cohen, 2006; Pellizzoni, Siegal & Surian, 2009)

read more


写给学心理学的

no comments
May 16 2011 小笔记

      之前随意翻了一下心事鉴定组的文章,有点看不下去,于是写了这篇文章。谢谢心事的编辑0.618,引起了各路高手回帖,连科学松树网的创始人姬十三也推荐了这篇文章。

原文题目是:心事鉴定组是另一种的娱乐节目?心理学是实验性的作秀?(请看这里)

      喜欢看我“斗嘴”的,可以看看我对果壳网的这篇《本性难移,天命难违》(千年谜团终被破解)的评论,是关于MBTI性格测试的。(请点击下面的百度快照)  发帖的人把原帖删了,(却又重新发了一模一样的帖子上果壳,是不想大家看到我们先前对他的“批判”么?)对他,我实在无言了。也没必要讨论下去。

      百度快照:第1页   第2页  第3页   (留个纪念)

心理学是实验性的作秀?

前些天,和一位中大的研究生聊天时说到,社会心理的研究,以下为聊天内容:


和一位中大研究生聊天

She: 觉得社会心理的东西就是在印证common sense,而且就算作出一点unexpected的东西来,也么有什么意义感。感觉那 一个小小的点,只能作为茶余饭后的谈资

Me:而且心理学的研究我觉得正反说都能找到实验来验证

She: 就是就是正反面证据都一堆

Me:而做实验 就是设计一个符合自己假设的实验 去“证明”自己的想法

She:我之前做实验,更加悲剧的事情是,实验一显著了,es还很大,实验二探讨中介时加了个量表,方向都反过来了。我觉得超级不靠谱啊 [注es指effect size]

Me:哈哈

She:社会心理学老是做的跟寓言似的,用一个行为指标来推理一个抽象概念其实换个行为指标就不显著了

再看看中大心理系微博上的一条新闻:

“不要再为下雨天郁闷了。研究发现,人们在雨天比在晴天能记住并回忆出更多在商店中出现过的物品。这是因为,天气好的时候,心情也好,就会忽略身边的环境;相反,天气糟糕时,人们的负面情绪却会使人更加关注身边的环境,思考也会更加谨慎。”

read more


« Older Entries

决策

  • Behavioural Finance(很不错的inventory)
  • Decision Science News
  • knowing and making(它的博客右侧列了我喜欢的blog)

我佩服的人

  • 学而时嘻之

英文

  • Evolutionary Psychology(宾大一个教授的blog)
  • Keith Sawyer(研究团体创造力)
  • Oscillatory Thoughts (Berkeley毕业)
  • 最热的25篇心理学期刊论文 (by ScienceDirect)

Categories

  • 小笔记 (10)
  • 用户体验研究 (3)
  • 留学在美国 (5)
  • 读Paper (16)

  • 关于
  • 迷路了
Powered by Wordpress  |  Designed by WebTreats