南京航空航天大学开源ALiPy:用于主动学习的Python工具包

南京航空航天大学开源ALiPy:用于主动学习的Python工具包

kyle

2019-01-18 发布68 浏览 · 1 点赞 · 0 收藏

近日,来自南京航空航天大学的研究者提出并开源了一个用于主动学习的 Python工具包 ALiPy。它不仅提供 20 余种当前最优算法的实现,还支持用户在不同主动学习环境下轻松配置和实现自己的算法。

  • 论文链接:https://arxiv.org/pdf/1901.03802.pdf

  • ALiPy 官网地址:http://parnec.nuaa.edu.cn/huangsj/alipy/index.html

简介

ALiPy 可为主动学习框架提供基于模块的实现,允许用户便捷地评估、对比和分析主动学习方法的性能。它可实现超过 20 种算法,还支持用户在不同的设置下轻松实现自己的方法。

特征

模型独立

不限制分类模型的类型。用户可以按需求在 sklearn 中使用SVM,或者在 TensorFlow 中使用深度模型。

模块独立

用户可随意修改工具包中的一或多个模块,对其他模块不会产生影响。

无需继承即可实现自己的算法

对用户自定义函数限制极少。

支持不同设置

支持 Noisy oracles、Multi-label、Cost effective、Feature querying 等设置。

强大的工具

保存和加载中间结果、多线程、分析实验结果等。

快速启动

用户可以通过以下命令启动 ALiPy:

pip install alipy

详细安装指南,参见 http://parnec.nuaa.edu.cn/huangsj/alipy/installation.html。

  • 对于不太熟悉主动学习、只是想对数据集应用该方法的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/page_adv/encapsulation_alexperiment.html,即可使用几行代码运行主动学习流程,无需了解任何背景知识。

  • 对于想要对现有主动学习方法进行实验评估的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/alipy_overview.html,了解 7 种不同设置下的 20 余种当前最优算法。

  • 对于想要实现自己的算法、执行主动学习实验的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/10_mins_to_alipy.html,学习如何使用 ALiPy 轻松实施主动学习实验。

实现策略

ALiPy 目前提供不同主动学习设置下的多种常见策略,新算法将会在后续更新中逐步添加。

如上图所示,ALiPy 提供的 20 多种算法涉及实例选择、多标签数据、特征查询等不同设置。ALiPy 官网上还展示了 ALiPy 在实例查询等设置下的运行机制。如下所示:

实例查询

Noisy Oracles

不同成本数据集

特征查询

 

--- 文章来源:https://www.jiqizhixin.com/articles/2019-01-18-7