做这个算法的最大难处是获取带物种类别标注的数据, 先期收集过程比较艰难, 后面逐渐成熟了, 策略大致为: 在微博和贴吧里认识昆虫, 混个眼熟; 在专业网站上收集昆虫名字列表和图像; 利用嘎嘎昆虫网以及一些昆虫志确定昆虫的中文名.
目前算法初版已经上线, 可见下图效果, 当前支持识别 2037 个昆虫 (或其他节肢类动物)分类单元 (可能是目,科, 属, 种或形态等), 大都是国内常见种. 提供这个工具主要是辅助识别 (提供了前5个最接近的分类单元), 准确的识别还得靠人. 如果能对大家起到一点点作用, 我就心满意足了.
由于种种原因, 目前识别算法支持的物种还不多, 精度也很有限, 物种的中文名和学名还存在一些错误, 不过由于兴趣所在, 我会持续扩充物种类别, 提升算法精度, 修正错误和增加新的功能, 同时也希望能得到大家的反馈和指导.








