基于手绘UI草图的高保真线框图自动生成研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:mrchenbx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户界面(User Interface,UI)原型设计是以用户为中心的应用软件开发过程中必不可少的一步。在界面原型设计的早期阶段,设计人员并不知道界面应该是什么样的,此时通常会使用线框图(Wireframe)进行探索。线框图是用户界面的图形化骨架,按照细节实现的程度,可分为低保真线框图和高保真线框图。低保真线框图是线框图的粗糙和基础表示版本,通常在纸上进行绘制,用于试验设计人员最初的想法,传达设计人员的意图。高保真线框图是对最终产品更完整的表述,需要花费更多的精力来创建,通常使用原型软件工具来创建。高保真线框图有助于传达美学特征和理解基本功能,但是创建高保真线框图是耗时耗力的,此外使用原型工具也需要额外的学习成本。因此,本文研究了如何利用深度学习技术来检测手绘UI草图中的组件(Component),并根据检测结果来自动生成高保真线框图,最后本文设计并实现了一个原型工具插件来实现从手绘UI草图到高保真线框图的自动转换,节省了设计人员创建高保真线框图的时间,提高了原型设计效率。自动生成高保真线框图最关键的一步就是准确地识别出手绘UI草图中各个组件的类型和位置大小,这是一个特定领域的目标检测任务。在现有的用户界面组件检测研究中,通常使用传统的计算机视觉方法或者基于深度学习的方法。前者需要手动提取特征,并根据经验来设置启发式规则,过程繁琐复杂,准确率也较低。而后者是一种端到端的学习模型,利用神经网络自动提取特征,准确率更高。因此,本文对基于深度学习的UI组件检测方法进行了研究,并总结了现有的深度学习方法在手绘UI草图检测中存在的问题:(1)手绘UI草图数据集收集需要耗费大量人力,成本昂贵,因此训练数据量较少,在使用深度学习进行UI组件检测时,通常会使用在自然图像上预训练好的模型,而草图与自然图像的特征差异较大,造成了在训练检测网络时收敛较慢,准确率较低;(2)草图中有用的像素点较为稀疏,存在大量无用的背景信息,在使用卷积网络进行特征提取时,在分层卷积过程中,会造成稀疏的笔划信息丢失,使得对草图的识别变得困难;(3)用户界面各个组件使用频率差别很大,导致训练数据集中类别不平衡的问题,使得网络模型容易偏向样本量较大的组件,进而使得样本量较小的组件识别准确率较低。针对以上问题,本文改进了Faster R-CNN目标检测算法来检测手绘UI草图中的组件,并为原型软件工具Adobe XD开发了一款插件来帮助设计人员通过手绘UI草图快速创建高保真线框图。本文的主要工作如下:(1)针对草图与自然图像差异过大,使用基于自然图像的预训练模型导致检测模型准确率较低的问题,本文构建了一个大规模的UI草图组件数据集,并用其对本文的目标检测网络进行了预训练,加快了网络的收敛速度,使模型的m AP增加3.6%。(2)针对卷积过程中,存在草图稀疏的笔划信息丢失的问题,本文提出了采用基于置换注意力机制的残差网络来提取手绘UI草图的特征,它融合了通道注意力和空间注意力,可以帮助网络学习到更有用的特征,忽略不重要的信息,使模型的m AP提高了4.6%。(3)针对训练数据中类不平衡问题,本文使用了焦损失(Focal Loss)来改进Faster R-CNN中的多分类交叉熵损失,使得网络更关注分类困难的样本,减轻对易分类样本的过拟合,提高了对困难样本的检测精度。(4)本文为现有流行的原型软件工具Adobe XD开发了一款基于手绘UI草图的高保真线框图自动生成插件,并将改进后的手绘UI草图检测模型应用于该插件当中,通过该插件缩短了设计人员创建高保真线框图的时间,提高了原型设计效率。综上所述,本文通过改进Faster R-CNN目标检测算法,使其在手绘UI草图检测中的m AP达到了88.5%。最后,本文设计并实现了一款原型软件工具插件,帮助设计人员通过手绘UI草图自动生成高保真线框图。
其他文献
红外成像仿真技术能够有效克服时间、环境、地域的限制获取不同环境条件下的红外图像,传统基于场景建模的仿真方法存在建模复杂度高、建模时间长等缺点,随着增强现实技术的发展,在真实场景中加入虚拟仿真物体能够避免大范围的场景建模工作,方便快捷地生成红外仿真图像。为保证仿真图像的视觉效果更加逼真,需要重点解决虚实融合的辐射一致性问题,即虚拟景物和真实背景应具有一致的红外辐射。在真实环境中,探测器接收到的辐射值
互联网发展日新月异,在改变人们生活娱乐方式的同时,也拓宽了社交渠道。交流分享不再受到距离限制,但问题亦接踵而至,攻击性言论犹如附骨之疽充斥在网络世界中,破坏着绿色文明的网络交流环境。攻击性言论是针对特定个人、群体进行言语攻击或能引起观者不适的文字内容,常见于各种社交媒体平台。准确的自动化检测工具能有效遏制攻击性言论的泛滥,故研究聚焦于使用机器学习方法检测识别攻击性言论。攻击性言论相关子任务包括了检
随着知识图谱技术的发展与成熟,其作为一个结构化的知识库被应用到各个领域,尤其是在基于知识库的问答领域。知识库问答是其接受一个自然语言式的问句并经过语义理解后结合知识库返回答案,不同于传统基于关键字的检索式问答,知识库问答直接给出精准答案,不需要用户进行二次查找或推理,使答案获取方式更加简单高效。然而,目前知识库问答的整体准确率不高,其主要原因包括两点:实体名拼写不规范、问句上下文信息不足和知识库中
面部表情是一个人表达情绪最直接的形式之一。由于人机交互的发展,许多领域开始关注人脸表情识别。近几年深度学习方法显著提升了人脸表情识别准确率,但在实际应用中仍存在一些问题:首先,深度学习需要大量训练数据,但现有人脸表情数据库不足以训练出在实际应用中能产生可靠结果的深度神经网络;此外,不同个体的差异,如表达情绪的方式和表情强度的差异,也会给人脸表情识别带来挑战。现有大多数表情识别方法一般将表情分为离散
在教育领域,“个性化学习”一直是经久不衰的话题。受限于技术水平和师资力量,其一直未能在实践中得到广泛应用。近年来,快速发展的人工智能和互联网技术重塑了个性化学习,为其在实践中的广泛应用创造了契机。领域知识模型和用户特征模型是个性化学习的两个重要根基。在实践中,通常使用知识图谱来构建领域知识模型。实体识别是构建知识图谱的第一步。在教育领域,实体识别也被称为“知识元抽取”。在已有研究基础上,本文重点对
白内障是当今发病率和失明率最高的眼科疾病之一。对预防失明来说,在早期及时发现并准确诊断出白内障尤为重要。临床白内障诊断往往需要眼科医生专业的知识和丰富的经验,但贫困和边远地区的白内障患者通常因为缺少专门的眼科医生而错失了诊治的机会。深度学习技术发展至今,在许多图像分类任务中都得到了广泛而成功的应用,然而,在白内障的自动检测任务中仍然存在着巨大的挑战。这是由于白内障及眼部B超图像的两个特点:首先,白
作为日常生活中最常看到的自然景色之一,树木模型广泛出现在影视、游戏、航空、军事等领域,是计算机图形学中真实建模领域的重要研究课题。但树木本身具有很高的复杂度,使得通过人工方法进行树木三维建模的工作非常繁琐。同时,属于同一科目的树木在形态上具有高相似性但又略有不同,如果通过人工手段对由同一科目的树木组成的森林进行建模,其工作量将会成倍增长。为了实现高效率的树木建模,近年来研究者们提出了基于植物生长模
全景视频作为一种新兴的媒体输入形式,因具备高自由度,高沉浸感等特点被广泛应用于场景漫游系统中。然而,利用全景视频仅能够在固定路径上观看360°的场景信息,无法从任意视点观看场景,从而无法实现真正的场景自由漫游。为实现场景的自由漫游,通常采用基于深度图像的绘制技术(Depth-Image-Based Rendering,DIBR),利用已知的图像信息与深度信息合成场景中任意视点的图像。然而,在DIB
随着信息化技术的快速发展,以数据驱动为中心的数据库发展创新在诸多领域都有着显著作用,如材料领域,生物医学领域。但是面对不断增长的数据量、多源异构的数据特征的挑战,传统的关系数据库明显难以处理。例如,在材料领域,由于材料数据的多样性,各种材料之间没有统一的数据表达和记录方式,材料数据的应用目的和需求也各不相同,数据的存储愈加复杂。可利用NoSQL的无模式存储、高扩展性等特性来解决这一难题。作为NoS
新媒体和互联网技术推进了新课程改革,课堂教学的方式发生了深刻转变。基于陇南一中"未来课堂"历史教学实践的现状,选取《物质生活与习俗的变迁》教学设计案例进行分析研究。