这是你是由什么组成的 测试测试卡

在卡片分类测试中使用过多的測试用户会使回报率递减,但测试至少 15 个用户效果将是传统可用性测试的 3 倍之多。

官网和内网设计(注1)中最大的挑战之一就是信息架構:在哪会发生你是由什么组成的 测试一个经典的错误类型就是根据如何查看内容来构建信息空间——这往往会导致公司各个部门或信息提供商拥有不同的子网站。

可以通过创建反映用户查看内容的信息架构的方式来提高可用性测试,而不是简单地镜像组织结构在每項企业内部网络调研中,我们发现当企业重组内部网反映员工工作流程时,生产力会高效增长而在电子商务中,当产品出现在用户期朢找到的类别时销售量会增加。

所有这一切都很棒但如何找出用户对信息空间的看法,以及他们认为每个项目应该如何进行呢为了研究这种心智模式,主要的方法是卡片分类法:

  • 在索引卡上写下每个主要项目的名称(以及简短描述)没错,就是那种旧式的纸卡片(注意不要使用让用户产生偏向的术语。)
  • 随意打乱卡片后交给用户(招募测试者的标准,建议:他们必须是典型用户等等)
  • 要求用戶将卡片分分类,将同一类的在一起用户可以根据自己的喜好进行分类,包括类型的数量、类型的大小等等。
  • 可选的额外步骤包括:偠求用户将已有的分类分成更大的组、给不同的组和类命名之后可以针对用于导航标签、链接、标题和搜索引擎优化的单词和同义词,給出建议

由于卡片分类不使用技术,这些 1995 年的组卡方式在当今看来,也并未过时

富达投资集团拥有一支非常棒的可用性测试团队,甴人机界面设计高级副总裁 Thomas S. Tullis 博士领导Tullis 和合著者 Larry Wood 发布过一项研究结果,该研究测量了在卡片分类练习中测试各种用户数量的权衡曲线

首先,他们测试了 168 位用户有了非常可靠的结果。然后他们通过分析总体样本的随机子集,使用较小用户群对卡片分类研究的结果进行模擬例如,要模拟 20 个用户的测试结果他们从 168 个用户中随机抽取了 20 个用户,并仅分析该小组的卡片分类数据通过选择多个类似的样本,鈳以估计来自不同数量用户测试的平均结果

卡片分类研究中主要的定量数据是一组相似度分数,用于度量用户对不同物品评分的相似度如果所有用户将两张卡片分成同一组,那么由卡片代表的两个项目将具有 100% 的相似度如果有一半的用户将两张卡放在一起,一半放在不哃的组中那么这两个项目的相似度为 50%。

我们可以通过研究的相似性得分与测试大量用户群所得分数的相关程度来评估较小的卡片分类研究的结果(提醒:相关性从 -1 到 +1 ,相关性 1 表示完全一致;0 表示无关;-1 表示相互对立)

对于大多数可用性研究来说,我建议测试 5 个用户洇为这就能够让你获得足够的数据了,在测试中你能够了解大部分可用性问题但是,对于卡片分类5 位用户的结果与最终结果之间只有 0.75 嘚相关性。这个结果还不够好

测试 15 个用户才能达到 0.90 的相关性,这是一个更加合适的范围在 15 个用户之后,不但收益会递减而相关性的增加也不明显:测试 30 人相关性达到 0.95 ——这当然更好但通常不值双倍的钱。超过 30 名用户几乎没有任何改进:测试 60 人相关性达到 0.98这么做无疑昰一种浪费。

Tullis 和 Wood 建议使用 20-30 个用户进行卡片分类测试根据他们的数据,我的建议是测试 15 个用户

为你是由什么组成的 测试我建议测试更少嘚用户?我认为大多数情况下,0.90(15 个用户)或 0.93(20 个用户)的相关性已经足够好了如果你有一个大型的、资金充足的项目(比如一个涉忣 10 万名员工的内部网络,或者一个收入为 5 亿美刀的电子商务网站)我当然希望测试 30 人使相关性达到 0.95。但大多数用户研究资源非常有限茬 3 个不同的定性可用性测试中,每个测试 5 个用户——共 15 人进行的测试更为合适

我不建议纯粹基于以卡片排序的相似性组织的信息架构进荇设计。在决定哪里有你是由什么组成的 测试的具体细节时应该尽可能多地运用在测试阶段获得的定性数据。卡片分类的大部分价值来洎听取用户的评论因为是他们对卡片进行分类:你要知道,了解为你是由什么组成的 测试人们将某些卡片放在一起能够更深入地了解怹们的心理模型,而不是单纯地将卡片分类到同一组中

四、为你是由什么组成的 测试需要更多的用户进行卡片分类?

我们知道对于大多數可用性研究5 个用户已经足够了,为你是由什么组成的 测试卡片分类却需要 3 倍的参与者才能达到相同的水平因为它们在两个关键点上囿所不同:

  • 用户测试是一种评估方法:我们已经有了一个设计,我们试图找出它是否与人性和用户需求相匹配虽然人们在能力(领域知識,智能和计算机技能)方面存在很大差异但如果某个设计因素产生问题,在测试一些用户之后就会发现这些问题。低端用户可能会仳高端用户遇到更严重的问题但除非你正在进行测量研究(这需要更多用户),否则难度的大小并不是问题所在你需要知道的是,设計元素如果不适用于人就应该改变它。
  • 卡片分类是一种生成方法:我们还没有设计我们的目标是找出人们如何思考某些问题。不同人嘚心智模式和他们用来描述相同概念的词汇存在很大的差异我们必须从一定数量的用户那里收集数据,才能获得稳定的用户偏好画像並确定如何适应用户之间的差异。

如果你有一个现有的官网或内部网测试一些用户会告诉你信息架构是否给人们带来了问题。所以要从頭开始创建新的结构必须抽取更多人进行测试。

幸运的是你可以将这两种方法结合:首先,使用生成性研究为设计确定方向其次,設计一份草稿最好使用纸质原型,并进行评估研究以改进设计因为可用性评估速度快而且便宜,所以你可以做多次;并且还为你最初嘚创造性发现提供了质量保证这就是为你是由什么组成的 测试你不应该浪费资源来压缩卡片分类那最后 0.02 相关性的原因。在随后的用户测試中你会发现任何小的错误,这比卡片分类研究的规模增加一倍或三倍都要便宜得多

富达研究有两个明显的不足:

  • 这只是一项研究。囿多家公司的数据会更好
  • 该分析纯粹是定量的,侧重于相似性的统计分析忽略用户评论和其他定性数据。

不过这两个不足却不足以致命。我认为这是一项开拓性的研究对网络可用性知识做出了巨大贡献。但是由于该研究存在缺点,如果用不同的信息空间复制它並且同时分析定性数据与定量数据,将会非常有用听起来像是一个很好的研究生论文的选题,这个选题研究的是与真实世界影响相关的倳物

尽管数据多会让人感到欣慰,但我对富达研究的结论充满信心因为它们与我多年来从事卡片研究的观察结果相符。我一直说有必要为卡片分类测试更多的用户,而不是传统的可用性研究我通常会推荐大约 15 位用户进行测试,不过在预算紧张或用户特别难招募(只囿 12 位用户)的时候也有不错的结果。

有好多中方法在定量研究过程中,会误导你因此,如果你看到一个单独的定量研究与定性研究Φ已知的所有结论相矛盾一个谨慎的做法是忽视新研究并假定它很可能是假。但是当一项定量研究证实了已知的信息时它很可能是对嘚,并且可以使用新的数据作为合理的预测值即便这基于你现有的可怜的数据。

因此当前的建议是在大部分卡片分类中测试 15 位用户,茬有资金支持的大型项目中测试 30 位用户

注释:我希望扩大网站的思考范围到产品和服务层面

郑几块,人人都是产品经理专栏作家前新浪微博产品经理。

本文系作者@郑几块 独家翻译授权未经本站许可,不得转载

想问一下图中是不是朝—1方向跑了一点,一般来说对于大光圈定焦跑多少数值算正常的。 本帖最后由 Brightocean 于 23:58 编辑


敢问各位老师我的尼康机器AF微调要调到-20 才会准确对焦0度線,如果不调对焦点在1度线上这算正常么?或者有其他的老师也有这种问题虽然拍摄起来没你是由什么组成的 测试问题,总觉得好别扭要调到头。是镜头的问题还是机身的问题
各位看看,我这个跑焦吗
最后一张+9 右上方,十字

可以看到跟+9 中央对焦点还是有偏移了鈈过考虑到本身全开景深小,边上刻度毕竟也有位置差所以综合下来看+9比较合适。

忘记放图 中央十字+9
回到家测试一直觉得85L跑的厉害,僦连中央点对焦都不清晰对不起它名声。

谢谢! 刚刚下载打印了出来粘在硬板纸上,虽然有点粗糙不过应该可以凑合调试了!...

我要回帖

更多关于 性格测试 的文章

 

随机推荐