论文部分内容阅读
图像标注是训练计算机自动学习使用自然语言描述给定图像内容的任务。在这篇论文中,我们使用一种以中文为目标语言的图像标注深度学习模型。该模型使用一个卷积神经网络编码器将输入图像编码为固定长度的特征向量,随后将该特征向量用一个LSTM解码器映射为描述图像内容的中文文字。最终训练得到的模型能够有效地针对给定图片生成相应的中文描述,并在定性分析展现出了很好的效果。