Алгоритм рейтинга комментариев, способствующий хорошему обсуждению

Статья об алгоритмах, учитывающих ранжирование комментариев по нодам. Особенно интересным мне показалось блокирование проблемы существующими алгоритмами и монокультурные обсуждения. К сожалению, Пикабу часто сталкивается с этой проблемой.

Дополнительное сообщение от автора: ——

На таких сайтах, как Хабра, Пикабу, Reddit и Hacker News, существует древовидная система комментирования сообщений. Зарегистрированные пользователи могут голосовать за комментарии. Сайты используют баллы за комментарии двумя способами

1) Управление вниманием читателей к комментариям. Лучшие» комментарии появляются сразу под постом, а „худшие“ — в нижнем колонтитуле. Hubr слабо контролирует внимание читателей. Он только размывает «плохие» комментарии и не меняет их порядок. Однако я (вероятно, как и многие другие читатели) часто пролистываю комментарии, чтобы просто придерживаться двузначных значений рейтинга.

2) Давать какие-то привилегии авторам «хороших» комментариев. Например, некоторые сабреддиты требуют определенного рейтинга комментариев на конкретном сабреддите для того, чтобы отправить пост.

Кроме того, рейтинг комментариев естественным образом влияет на создателя. Положительные рейтинги побуждают авторов писать больше таких комментариев, в то время как отрицательные рейтинги не побуждают авторов писать меньше комментариев. Таким образом, рейтинги комментариев все равно неявно влияют на дискуссии на сайте.

Как рассчитываются рейтинги комментариев?

На большинстве сайтов вы можете проголосовать за или против комментария. В следующих постах мы рассмотрим только эту возможность. На Hacker News вы можете голосовать только за, но не против. На Medium вы можете, в некотором смысле, проголосовать за комментарий по номеру от 1 до 50 (вы также можете проголосовать за пост, в этом случае вы можете проголосовать против него). Фактически, комментарии на Medium считаются мини-постами).

На большинстве сайтов рейтинг комментариев рассчитывается как простая разница между голосами «за» и «против». Я не припомню ни одного сайта, где учитывались бы баллы пользовательских голосов. Reddit рассчитывает рейтинг комментариев по более сложному типу. Суть его заключается в том, что учитывается общая разница между голосами «за» и «против», а также ясность поддержки. Комментарий с 10 голосами «за» и 0 голосами «против» получает более высокий балл, чем комментарий с 100 голосами и 80 голосами «за».

Советуем прочитать:  Учебные пособия по теории вероятностей

Алгоритм подсчета рейтинга комментариев в конечном итоге отвечает на вопрос: какие комментарии считаются «хорошими», а какие — «плохими» и не заслуживающими внимания? На этот «демократический» вопрос отвечает простейшая разница в количестве голосов. Чем больше людей согласны с комментарием, тем меньше в нем мнений, тем он «лучше» и тем большего внимания заслуживает. В общем, то же самое относится и к алгоритму Reddit.

Я думаю, что почти все пользователи голосуют «за» комментарий и «против», когда они не согласны. Я не рассматривал случаи, когда они оценивают, голосуя за качество аргументов, даже если не согласны с ними (думаю, такие случаи единичны). На Tjournal пользователи оценивают комментарии по юмору, который в данном случае не представляет интереса.

Оценка комментариев по сырой общей поддержке приводит к следующей проблеме

Сообщества, как правило, находятся в состоянии монокультуры и группового мышления. Если в сообществе изначально есть небольшой перевес сторонников какого-то мнения, то комментарии к нему получают положительную оценку, а отличные комментарии — отрицательную. Те, кто придерживается непопулярных взглядов, перестают публиковать свои комментарии или покидают сайт.

Результат: почти все Sabreddits являются эксклюзивными, от тех, что посвящены технологиям, таким как Java и Golang, до преданности политическим партиям, вере в Бога и глобальному потеплению. Вы можете хорошо или плохо относиться к обсуждаемой теме; вы можете быть хорошим или плохим человеком в отношении обсуждаемой темы. То же самое можно сказать и о Hubr, но в меньшей степени.

Вторичные последствия монополии сообществ: поляризация общества в целом и общее снижение уровня критического мышления. Люди разбросаны по сообществам, где преобладают определенные взгляды, сидят в пузыре и постоянно получают одобрение. Их взгляды консолидируются, и они все меньше способны воспринимать аргументы против других взглядов.

Советуем прочитать:  Приложения для удостоверения личности: инструкции и необходимая документация

Аргументы не развиваются: на сайте есть только некоторые аргументы в пользу основной позиции. Чтобы получить больше позитива, автор старается нагрузить комментарии «основными» аргументами в пользу наиболее позитивных аргументов (с эмоциями) в предыдущих обсуждениях. Люди, которые смотрят на такие дискуссии, как C++ и Rust, Liberalism vs. Социализм, «не скептики» vs. Covid ‘sceptics’, могут заранее и очень точно предсказать, что именно и даже как будет написано в поддержку того или другого. Новички в споре также видят только эти тысячелетние аргументы и с большей вероятностью повторят их в дальнейшем.

Система готова выращивать ботов для голосования в пользу тех или иных мнений.

Ниже мы предлагаем идею нового алгоритма для подсчета классификации комментариев. Этот алгоритм должен замедлить (но в редких случаях полностью остановить) вышеописанную процедуру.

Идея алгоритма очень проста. Сайты должны обучить свои ML-системы оценивать неожиданность согласия или несогласия пользователя с тем или иным комментарием. Неожиданные голоса должны влиять на оценки комментариев гораздо сильнее, чем ожидаемые.

Очень часто (возможно, более чем в половине случаев) неожиданное голосование является просто ошибкой, поэтому сайты с такой системой должны обязательно проводить повторные голосования.

Неожиданное (но реальное) положительное голосование, скорее всего, означает, что комментарии содержат интересные аргументы и, возможно, полностью меняют мнение голосующего. Такие комментарии заслуживают самого пристального внимания.

Неожиданный голос «нет», скорее всего, означает грубость.

Если комментарий не содержит четких указаний на определенную позицию в дискуссии (таких комментариев большинство), или если голосующий в прошлом голосовал в основном или случайно, ни «да», ни «нет» нельзя назвать неожиданными или ожидаемыми. Такие голоса часто стоят меньше, чем неожиданные.

Ожидаемый голос стоит в два раза больше или даже в два раза меньше, чем неожиданный.

Как вы оцениваете ожидания от голосования?

Проведите анализ настроения всех комментариев на сайте, чтобы узнать, какие пользователи ранее голосовали «за» и «против». Затем семантический вектор комментария * (один голос «»за« „за “за йоту» «») сравнивается с вектором пользователя. Если векторы почти совпадают, голосование считается ожидаемым. Если они почти противоположны — неожиданным, если почти вертикальны — голосование считается ни ожидаемым, ни ожидаемым.

Советуем прочитать:  Студент и бустер на переднем сиденье

Такой рейтинг, даже при нынешнем качестве анализа настроений, кажется достаточно точным, чтобы сделать предложенную систему рейтинга в целом полезной, а не мусорной.

Семь лучших комментариев: 18-25 сентября

7 лучших комментариев: 18-25 сентября.

Мы продолжаем читать все комментарии о Myslo, и «читатели — самые плодовитые, остроумные, справедливые, иногда эгоистичные, иногда злые, но они все равно самые лучшие!». Мы убеждены, что так оно и есть.

Отсюда и подборка самых едких, уместных, а иногда и просто смешных комментариев пользователей.

Примечание к названию: «Экономия» История о жителе Тулы, который отдает долг.

Пьяный мужчина из Тулы устроил аварию, чтобы быстрее доставить своего кота в операционную!

В МЧС прокомментировали аварию на новомосковском «Азоте

Двое жителей Тулы отравились неизвестной жидкостью: один умер, другого пытаются спасти

Россияне, прибывшие из-за рубежа, должны сидеть в изоляции

Лето приходит в центральную Россию

Смотрите новости в удобном формате

©2005-2024 ООО «Слобода» Использование материалов сайта возможно только с письменного разрешения редакции. Материалы и статьи, отмеченные в рубрике «Корпоративный блог», «Афиша», «Корпоративные новости» и «На правах рекламы», являются рекламно-информационными материалами Myslo.ru Gate. Эл № ФС77-27611 от 21 марта 2007 г. выдано Федеральной службой по надзору в сфере защиты права и культурного наследия в сфере массовых коммуникаций.

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

Adblock
detector