[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: from ["Alexei Anatski" <[email protected]>] (fwd)



 Привет!

> > Земфира  5095
> Могли внести большие искажения реальные имена в различных списках
("Земфира
> Джураевна Рымбаева")

Не очень. Навскидку взятые 10 ссылок из разных частей 5000 дали искомое
(хотя часть - ругань) Т.е. < 10%

> >
> > ГрОб | Летов | "Гражданская Оборона"
> > 63298
> Вероятные искажения:
> Сергей Летов, однофамильцы в различных списках, тексты, рефераты и пособия
> по действиям мирного населения в условиях военных действий или катастроф
> :-). Рекламы похоронных бюро и художественные произведения про вампиров
> (скорее всего яндекс, как и ремблер, все слова индексирует только в одном
> регистре и перед поиском запрос приводится к этому регистру -- или я не
> прав?).

Сергея забыл, каюсь :-(
Большие и маленькие буквы - различаются ГрОб <> гроб.
"Гражданская Оборона" - словосочетание с большими буквами.


> > Аквариум | Гребенщиков
> > 43451
> Ну, сюда наверняка затесались всякие разводители аквариумных рыбок (!) и
> тексты Виктора Суворова и других разведчиков.
> Уж слово очень сильно распространенное.

см. выше.

> NB! Это все не наезды, а призывы к усовершенствованию методики. (Если это
> еще кому-то интересно).
>
> Мне все же кажется, что результаты хорошо кореллируют с реальным
положением
> дел.
> Может кто-нибудь предложить альтернативный способ проверки?

Мне тоже данные показались похожими на правду в пределах 10%. Соответственно
качественная картина установлена и дальше меня съела лень :-)

> Хотя любой способ будет выдавать сомнительные результаты, но если сравнить
> данные из нескольких источников и попытаться понять, почему были получены
те
> или иные данные...

Улыбок,
    Чацкий