[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: from ["Alexei Anatski" <[email protected]>] (fwd)
Привет!
> > Земфира 5095
> Могли внести большие искажения реальные имена в различных списках
("Земфира
> Джураевна Рымбаева")
Не очень. Навскидку взятые 10 ссылок из разных частей 5000 дали искомое
(хотя часть - ругань) Т.е. < 10%
> >
> > ГрОб | Летов | "Гражданская Оборона"
> > 63298
> Вероятные искажения:
> Сергей Летов, однофамильцы в различных списках, тексты, рефераты и пособия
> по действиям мирного населения в условиях военных действий или катастроф
> :-). Рекламы похоронных бюро и художественные произведения про вампиров
> (скорее всего яндекс, как и ремблер, все слова индексирует только в одном
> регистре и перед поиском запрос приводится к этому регистру -- или я не
> прав?).
Сергея забыл, каюсь :-(
Большие и маленькие буквы - различаются ГрОб <> гроб.
"Гражданская Оборона" - словосочетание с большими буквами.
> > Аквариум | Гребенщиков
> > 43451
> Ну, сюда наверняка затесались всякие разводители аквариумных рыбок (!) и
> тексты Виктора Суворова и других разведчиков.
> Уж слово очень сильно распространенное.
см. выше.
> NB! Это все не наезды, а призывы к усовершенствованию методики. (Если это
> еще кому-то интересно).
>
> Мне все же кажется, что результаты хорошо кореллируют с реальным
положением
> дел.
> Может кто-нибудь предложить альтернативный способ проверки?
Мне тоже данные показались похожими на правду в пределах 10%. Соответственно
качественная картина установлена и дальше меня съела лень :-)
> Хотя любой способ будет выдавать сомнительные результаты, но если сравнить
> данные из нескольких источников и попытаться понять, почему были получены
те
> или иные данные...
Улыбок,
Чацкий