EBOR:一种用于不平衡数据集学习的有效边界过采样方法

来源 :中国化学会第28届学术年会 | 被引量 : 0次 | 上传用户:chenlinwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  由于不平衡数据集本身拥有的复杂特性,标准的机器学习算法在不平衡数据集上的分类存在明显的性能缺陷,由此引发的不平衡问题遍布于现实世界诸多重要领域.为了试图解决这一问题,提出一种新的少数类边界过采样方法EBOR.在EBOR 中,新的K 广义Tomek 连接(简称K 连接)概念用于帮助定位少数类边界样本,进一步,基于边界样本的K 连接数目实现自适应合成过采样.
其他文献
  The efficient formation of 5-methylcytosine glycol (mCg) and its facile deamination to thymineglycol (Tg) may account for the prevalent C→T transition muta
会议
  在日常检测工作中,国家标准、行业标准、地方标准或者是企业标准是衡量所检项目是否合格的准绳。然而,当测得值接近质量标准临界限时,被检测产品合格与否还必须依据检测项目
美国文学理论家韦勒克和沃伦,在他们经典的著作《文学理论》中,曾经提出一个对于文学理论研究中“内部研究”和“外部研究”进行区分的框架。而对于作为交叉学科的广告学来说
  本文针对表面增强拉曼光谱(SERS)中信号稳定性和重现性问题,提出了一种用于SERS准确定量分析的方法。将适量对甲苯硫酚通过金属-硫键耦合到银(金)纳米颗粒形成单分子亚层,
“神龟虽寿,犹有竟时;腾蛇乘雾,终为土灰。老骥伏枥,志在千里;烈士暮年,壮心不已。盈缩之期,不但在天;养怡之福,可得永年。幸甚至哉!歌以咏志”。这是曹操脍炙人口的一首言志诗。诗中不仅展现了曹操垂暮之年那种积极进取、壮志不衰的雄风和豪迈超脱的胸襟,也集中地体现了他的养生思想。  历史上的帝皇虽贵为“天子”,但面对死亡也都无可奈何。秦皇、汉武、唐宗、宋祖等君主,都曾做过“长生不死梦”,迷恋着长生不老,
超临界(02作为非水压裂液,具有增加页岩气产量、减少需水量和减轻环境影响的潜力.结合实验和模拟数据,阐释了使用超临界CO2作为工作流体用于页岩气开发的利弊,分析了CO2的潜
  细胞信号转导是指细胞通过胞膜或胞内受体感受信息分子的刺激,经细胞内信号转导系统转换,从而影响细胞生物学功能的过程。研究表明许多重要的生物学过程均涉及到信号通路,挖
1.选好草莓主栽品种 半促成栽培关键是选择冬季休眠期短、开花结果早的草毒品种。如丰香、鬼怒甘、春香、霉宝、宝交早生、硕丰等品种。 2.整地,施足基肥 生产大田应选土层深厚、
  高通量RNA测序技术(mRNA-Seq)[1]的快速发展为在核苷酸水平上的转录研究提出了更深入的视角和有效的方式法。测序技术[2]产生了海量复杂的序列数据,这些序列数据包含了大
  使用Marcus 模型,在B3LYP/6-31G**水平计算研究F、OH、OCH3、SH、SCH3 取代四苯基[a,c,h,j]蒽衍生物分子的电荷传输性质.计算结果表明,在室温300 K 下,F 取代和SH 取代分