丁香是一个开源工具,通过改善数据来改善产品的数据和AI从业者的工具。
要使用丁香,您可以通过pip install lilac进行安装。安装完成后,您可以使用Python界面或命令行界面搜索、量化、编辑和比较数据字段。丁香还提供了聚类、语义和关键字搜索、模糊概念搜索以及检测PII、重复项、语言或自定义信号等功能。
数据探索和质量控制
选择适合任务的正确数据
全部({{commentRowsTotal}})