Một nhóm các nhà phát triển tại Yahoo-Labs đã "lặn ngụp" trong hàng triệu comment, sau đó phát triển và đưa ra một công cụ có thể sẽ giúp việc phát hiện và hạn chế những lời bình luận có tính thù ghét và lạm dụng trên mạng xã hội.
Công cụ này sử dụng cơ sở dữ liệu độc nhất, được gom lại từ các comment tìm thấy trên các diễn đàn của Yahoo. Nhóm phát triển đã nghiên cứu và đưa ra một thuật toán được cho là công cụ lọc nội dung tốt nhất từ trước tới nay.
Hầu hết các công cụ lọc nội dung hiện này đều dựa trên nguyên tắc loại bỏ các nội dung có chứa từ bị cấm, nhưng nhóm phát triển Yahoo đã áp dụng thêm công nghệ tự động học vào công cụ của mình. Công cụ này sau đó sẽ có thể sử dụng một phương pháp "nhúng từ" có thể xử lý từ ngữ trong một vế thay vì chỉ từng từ.
Công cụ này được cho là sẽ có thể phát hiện một ý xấu trong câu, ngay cả khi các từ cấu thành không có ý nghĩa tiêu cực, giả dụ như một câu nói mỉa mai.
Theo thử nghiệm, công cụ đã có thể xác định nội dung tiêu cực với độ chính xác lên tới 90% ở nhiều ngôn ngữ khác nhau. Đây là một tỷ lệ đáng ngưỡng mộ, bởi ngay cả con người cũng không thể xác định ý nghĩa một câu nói mỉa mai với độ chính xác là 100%.