<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Заметки — Игорь К.: заметки с тегом Статистика</title>
<link>https://blog.fossko.ru/tags/statistika/</link>
<description>Блог Игоря К. о маркетинге, аналитике, фотографии и жизни...</description>
<author></author>
<language>ru</language>
<generator>Aegea 11.4 (v4171)</generator>

<itunes:subtitle>Блог Игоря К. о маркетинге, аналитике, фотографии и жизни...</itunes:subtitle>
<itunes:image href="" />
<itunes:explicit></itunes:explicit>

<item>
<title>Можно ли считать выборки различными или что такое распределение Стьюдента</title>
<guid isPermaLink="false">53</guid>
<link>https://blog.fossko.ru/all/mozhno-li-schitat-vyborki-razlichnymi-ili-chto-takoe-raspredelen/</link>
<pubDate>Sat, 25 Apr 2020 11:19:20 +0300</pubDate>
<author></author>
<comments>https://blog.fossko.ru/all/mozhno-li-schitat-vyborki-razlichnymi-ili-chto-takoe-raspredelen/</comments>
<description>
&lt;p&gt;Давайте представим что у нас в редакции работают 10 авторов, при этом у нас 5 мальчиков и 5 девочек.&lt;br /&gt;
У нас есть предположение что девочки работают хуже.&lt;br /&gt;
Мы взяли и посчитали сколько текстов пишет каждый автор за неделю.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://blog.fossko.ru/pictures/t-----Google----Opera-2020-04-25-10.46.19.jpg" width="825" height="225" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;У нас в среднем мальчики пишут 4,4 материала, а девочки 2,6, похоже что девочки работают хуже мальчиков.&lt;/p&gt;
&lt;p&gt;В статистике существует t-критерия Стьюдента, он показывает с какой вероятностью мы ошибемся если будем считать что две выборки одинаковые. Считается он по степеням свободы — это количество значений в выборке минус 2, в нашем случает 10−2=8&lt;/p&gt;
&lt;p&gt;t-критерия Стьюдента = (Разница средних) / Корень квадратный(дисперсии 1 распределения/количество элементов 1 распределения+ дисперсии 1 распределения/количество элементов 2 распределения)&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=ABS(B8-E8)/SQRT(VAR(B2:B6)/5+VAR(E2:E6)/5)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;В нашем случае критерий равен 1,9877&lt;/p&gt;
&lt;p&gt;Но сам критерий нам не нужен, нам нужно понимать на сколько выборки различные, для этого есть функция  которое возвращает распределение, оно считается по критерию, степеням свободы.&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;=T.DIST(D14;8;TRUE)&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;и в нашем случае он равен 0,9589, что значит что выборки различны на 95,89% или одинаковы на 4,11%&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://blog.fossko.ru/pictures/t-----Google----Opera-2020-04-25-10.46.54.jpg" width="748" height="394" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;Неплохой результат, можно сказать что группа мальчиков работает лучше группы девочек.&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;b&gt;Одураченные случайностью&lt;/b&gt;. Все бы ничего, если посмотреть наши данные, то можно увидеть, что наши данные сгенерированы случайно броском кубика.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://blog.fossko.ru/pictures/t-----Google----Opera-2020-04-25-10.46.19.jpg" width="825" height="225" alt="" /&gt;
&lt;div class="e2-text-caption"&gt;RANDBETWEEN — это функция которое случайным образом выдает значение в определенном интервале, в нашем случает интервал 1;6 — это игральные кости.&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;Давайте попробуем обновить данные и увидим что все критерии изменились, как и данные&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;div class="fotorama" data-width="780" data-ratio="1.9847328244275"&gt;
&lt;img src="https://blog.fossko.ru/pictures/t-----Google----Opera-2020-04-25-11.08.22.jpg" width="780" height="393" alt="" /&gt;
&lt;img src="https://blog.fossko.ru/pictures/t-----Google----Opera-2020-04-25-11.08.48.jpg" width="747" height="381" alt="" /&gt;
&lt;img src="https://blog.fossko.ru/pictures/t-----Google----Opera-2020-04-25-11.09.46.jpg" width="774" height="423" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-caption"&gt;Выкидывая так кубики, мы можем докидаться так что получить результат наоборот&lt;/div&gt;
&lt;/div&gt;
&lt;p&gt;&lt;a href="https://docs.google.com/spreadsheets/d/1D6OKWhpxNjK7HULdNEPhwxBYlYeJh92ojCJ0kIX3mT8/edit?usp=sharing"&gt;Образец таблицы&lt;/a&gt; на которой я бросал кубики, копируйте к себе и бросайте&lt;/p&gt;
&lt;p&gt;Мастер класс по такому бросанию кубиков очень классно показал Максим Дорофеев.&lt;/p&gt;
&lt;div class="e2-text-video"&gt;
&lt;iframe src="https://www.youtube.com/embed/dv1tv81Z_0M?enablejsapi=1" allow="autoplay" frameborder="0" allowfullscreen&gt;&lt;/iframe&gt;
&lt;div class="e2-text-caption"&gt;Максим Дорофеев «Шум, моча и open office: научная работа по психологии (как она есть и как ее цитируют)» с 10:39&lt;/div&gt;
&lt;/div&gt;
</description>
</item>


</channel>
</rss>