南京航空航天大学开源ALiPy:用于主动学习的Python工具包
近日,来自南京航空航天大学的研究者提出并开源了一个用于主动学习的 Python工具包 ALiPy。它不仅提供 20 余种当前最优算法的实现,还支持用户在不同主动学习环境下轻松配置和实现自己的算法。
-
论文链接:https://arxiv.org/pdf/1901.03802.pdf
-
ALiPy 官网地址:http://parnec.nuaa.edu.cn/huangsj/alipy/index.html
简介
ALiPy 可为主动学习框架提供基于模块的实现,允许用户便捷地评估、对比和分析主动学习方法的性能。它可实现超过 20 种算法,还支持用户在不同的设置下轻松实现自己的方法。
特征
模型独立
不限制分类模型的类型。用户可以按需求在 sklearn 中使用SVM,或者在 TensorFlow 中使用深度模型。
模块独立
用户可随意修改工具包中的一或多个模块,对其他模块不会产生影响。
无需继承即可实现自己的算法
对用户自定义函数限制极少。
支持不同设置
支持 Noisy oracles、Multi-label、Cost effective、Feature querying 等设置。
强大的工具
保存和加载中间结果、多线程、分析实验结果等。
快速启动
用户可以通过以下命令启动 ALiPy:
pip install alipy
详细安装指南,参见 http://parnec.nuaa.edu.cn/huangsj/alipy/installation.html。
-
对于不太熟悉主动学习、只是想对数据集应用该方法的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/page_adv/encapsulation_alexperiment.html,即可使用几行代码运行主动学习流程,无需了解任何背景知识。
-
对于想要对现有主动学习方法进行实验评估的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/alipy_overview.html,了解 7 种不同设置下的 20 余种当前最优算法。
-
对于想要实现自己的算法、执行主动学习实验的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/10_mins_to_alipy.html,学习如何使用 ALiPy 轻松实施主动学习实验。
实现策略
ALiPy 目前提供不同主动学习设置下的多种常见策略,新算法将会在后续更新中逐步添加。
如上图所示,ALiPy 提供的 20 多种算法涉及实例选择、多标签数据、特征查询等不同设置。ALiPy 官网上还展示了 ALiPy 在实例查询等设置下的运行机制。如下所示:
实例查询
Noisy Oracles
不同成本数据集
特征查询