演讲者日志化:它对语音到文本的准确转录有何重要意义
2024 年 8 月 20 日
众包已经成为收集各种人工智能应用数据的重要工具,拍卖可以成为众包平台中分配工作和确定奖励的有效方式。在本文中,我们专注于小任务的众包,如图像标签和语音记录,在这方面我们面临着一些挑战。首先,工人对他们愿意做的工作量有不同的限制,他们也可能在工作竞标中误报这些限制。其次,如果拍卖长期重复进行,不成功的工人可能会退出系统,减少竞争和多样性。为了解决这些问题,我们首先将著名的迈尔森单参数出价的最优拍卖机制的结果扩展到出价由工作的单位成本、自己愿意做的最大工作量和实际完成的工作组成的情况。我们表明,一个简单的支付机制足以确保工人的主导策略,而且这种主导策略对工人的真实效用函数是稳健的。其次,我们提出了一种新的、灵活的工作分配机制,它允许请求者在成本效率和平等之间取得平衡。虽然成本最小化显然很重要,但在工作分配中鼓励平等,可以增加劳动力的多样性,并促进对众包平台的长期参与。我们的主要结果是通过分析证明的,并通过模拟验证。