Статистика 6.0 и NCSS 2007 считают по разному кластерный анализ. Все настройки которые возможны учёл, многократно проверил, даже на всякий случай попробовал разные варианты. Ward`s method, Euclidean distances, Raw data; NCSS - original variables, Scaling method - St.dev. +другие попробовал. NCSS считает cluster cutoff, поставил значение чтоб оставалось 5 кластеров, принадлежность образца к какому либо кластеру записывается в отдельный столбик. В статистике столбик cases, где видно, какой case на какой ветке, можно созерцать на самой диаграмме или выделить и скопировать из customer labels из настроек диаграммы. если сравнить даже какой нибудь небольшой участок в середине одного из 5 основных кластеров создаваемых статистикой и найти в какой кластер из 5 их записала NCSS, то видно что эти же образцы (cases), которые в Статистике стоят рядом явно внутри одного из 5 основных кластеров (даже ближе, они остаются в одном. даже если 10 кластеров выделить) NCSS записала их же в 2-3 разных кластера из 5. Я сравнил в екселе с помощью условного форматирования выделяющего цветом одинаковые значения, вставляю блок cases одного кластера из пяти из статистики и тут же смотрю разброс этих же cases по 2-3 разным кластерам из 5 по мнению NCSS. То есть, значит изза какихнибудь не регулируемых настроек программ, их кластерный анализ не сопоставим? То есть я не могу анализировать свойства cases попавших в один кластер и отличие таковых от cases в другом кластере в статистике, используя cutoff от NCSS. Потому что то что есть один кластер в Статистике, при тех же доступных настройках - микс из кластеров NCSS. (Мне это нужно, потому что в статистике нет функции cluster cutoff, приходится долго вручную выуживать ряды cases относящиеся к 1 кластеру).
» Статистические пакеты: сравнительный анализ
плюс статистики перед СПСС в том, что в ней хелп куда продуктивней чем в СПСС. В спсс дурацкий учебник. Мало примеров для объяснения метода. В статистике больше гибких настроек чем в спсс . Новичку лучше начинать со статистики , она проще в освоении. Хотя не спорю, в спсс удобнее сделана процедура обозначений переменных, какая номинативная, ранговая, колич, ну и графики там эргономичнее чем в статистике. Нагляднее.
НО! Почему щас я стал ипацца с САС
дело в том, что все исследования мировые, по крайней мере в медицине делаются, вернее прогаются под САСом. Вызвано это тем, что эксперимент должен быть воспроизведен, и именно программируя ход анализа, другой исследователь видит что и как вы делали. При кнопочном интерфейсе не всегда могут быть получены одинаковые р-ты. ибо не известно, что было внутри программы. Вот и идет такая унификация. Хотя странно, что в качестве идентичного стандартна не юзается тот же R
Кстати есть ли на этом форуме раздел посещенный ему?
НО! Почему щас я стал ипацца с САС
дело в том, что все исследования мировые, по крайней мере в медицине делаются, вернее прогаются под САСом. Вызвано это тем, что эксперимент должен быть воспроизведен, и именно программируя ход анализа, другой исследователь видит что и как вы делали. При кнопочном интерфейсе не всегда могут быть получены одинаковые р-ты. ибо не известно, что было внутри программы. Вот и идет такая унификация. Хотя странно, что в качестве идентичного стандартна не юзается тот же R
Кстати есть ли на этом форуме раздел посещенный ему?
Очень хорошо о SPSS, NCSS еще и моей любимой Stata написано здесь: http://www.statistical-software.net/ Хоть и на английском, но все по факту
А как в этих пакетах реализованы нейросети? Можно сравнительный анализ?
Предыдущая тема: Kaspersky Internet Security 2006 / KIS
Форум Ru-Board.club — поднят 15-09-2016 числа. Цель - сохранить наследие старого Ru-Board, истории становления российского интернета. Сделано для людей.