Статистическое моделирование на ЭВМ дискретных случайных величин средствами языка программирования R
Автор: Дмитриев Игорь Александрович
Рубрика: 4. Информатика
Опубликовано в
XI международная научная конференция «Исследования молодых ученых» (Казань, июнь 2020)
Дата публикации: 01.06.2020
Статья просмотрена: 180 раз
Библиографическое описание:
Дмитриев, И. А. Статистическое моделирование на ЭВМ дискретных случайных величин средствами языка программирования R / И. А. Дмитриев. — Текст : непосредственный // Исследования молодых ученых : материалы XI Междунар. науч. конф. (г. Казань, июнь 2020 г.). — Казань : Молодой ученый, 2020. — С. 5-8. — URL: https://moluch.ru/conf/stud/archive/374/15897/ (дата обращения: 29.03.2024).
В статье рассматривается моделирование случайных величин, вычисление параметров случайных величин по выборке и изучение свойства состоятельности выборочных оценок средствами языка программирования «R».
Ключевые слова: моделирование, случайная величина, язык R.
Пользуясь средствами языка программирования «R«, рассмотрим процесс реализации на ЭВМ и исследования на точность алгоритма моделирования случайной величины, распределенной по геометрическому закону G(p):
(1)
где — заданный параметр распределения.
Дискретная случайная величина (ДСВ) ξ с геометрическим законом распределения есть число испытаний Бернулли до первого успеха (включая первый успех), если вероятность успеха в каждом испытании равна р [1, с. 22].
Метод моделирования ДСВ ξ с законом распределения G(p) основан на следующей теореме [2, c. 55]:
Теорема. Если R — биномиальная случайная величина (БСВ), то случайная величина
(2)
где [z] — целая часть z, имеет распределение (1).
Реализуем на языке программирования «R» моделирование n независимых случайных чисел, имеющих геометрическое распределение:
> n = 100; # количество независимых случайных чисел
> p = 0.5; # заданный параметр распределения
> eta = с( ); # вектор независимых случайных чисел
> geo = function(n, p) # функция для моделирования случайной величины
+ { R = runif(n);
+ for (i in 1:n) { eta[i] <- floor( log( R[i] ) / log( 1 - p ) ); }
+ return (eta);}
> ksi = geo(n,p); # моделирование случайной величины
Построим полигон относительных частот и полигон распределения
вероятностей при различных объемах выборок (n = 100, n = 1000, n = 10000). Для решения данной задачи используем следующий программный код:
> n1= table(ksi); # распределение частот случайных величин
> otn = n1/n; # распределение относительных частот
> plot(otn, "b", pch=19, col="red", xlab="Случайная величина",ylab="Относительная частота", lty=1); # графическое отображение
> x <- (min(ksi):max(ksi)); # вектор независимых случайных чисел
> y <- dgeom(x,p); # вектор теоретической плотности распределения
> lines(x,y,"b", pch=19,col="blue", lty=2);
Графические результаты приведены на рис. 1–3. На их основании можно утверждать, что с увеличением объёма выборки график полигона относительных частот стремится к полигону распределения вероятностей.
Аналогично с увеличением объема выборки, график эмпирической функции распределения также стремится к теоретической функции распределения. Графический результат для объёма выборки n = 10000 приведён на рис. 4.
Рис. 1. Графики полигона относительных частот и теоретического полигона распределения вероятностей, n=100
Рис. 2. Графики полигона относительных частот и теоретического полигона распределения вероятностей, n=1000
Рис. 3. Графики полигона относительных частот и теоретического полигона распределения вероятностей, n=10000
Рис. 4. Графики теоретической и эмпирической функции распределения, n=15000
Для построения графиков эмпирической и теоретической функций распределения используем следующий программный код:
> y1 <- pgeom(x,p); # вектор теоретической функции распределения
> plot(x, y1, col="black", xlab="Случайная величина", ylab="Функция распределения"); # графическое отображение
> for(i in (min(ksi):max(ksi)))
+ { y <- pgeom(i,p); lines(c(i,i+1),c(y,y),"l")}
> k <- 0; for (i in (min(ksi):max(ksi)))
+{x11<-c(i:(i+1)); k<-k+otn[i+1]; y11<-c(k,k); lines(x11,y11,col="blue");}
Будем использовать следующий программный код для вычисления теоретических и выборочных математического ожидания и дисперсии:
> vmo = mean(ksi); # выборочное мат. ожидание
> mteor = (1-p)/p; # теоретическое мат. ожидание
> vd = var(ksi); # выборочная дисперсия
> dteor = (1 - p) / ( p*p ); # теоретическая дисперсия
Чтобы убедиться в состоятельности выборочной оценки математического ожидания, реализуем средствами языка программирования «R» решение следующих задач: построить график стремления выборочной оценки параметра распределения к параметру распределения по вероятности с увеличением объема выборки n; построить линию параметра; построить доверительные границы, используя неравенство Чебышева. Реализацию решения выполняет следующий программный код:
> mx<-c(); for (j in (1:n)) { mx[j]=mean(rgeom(j,p)); }
> plot((1:n), mx, 'l', xlab='n', ylab='выборочное среднее');
> a1=c(1,n);b1=c(mteor, mteor); lines(a1,b1, col='red');
>pu=mteor+sqrt((1-p)/((1:n)*(p*p)*(1-0.95))); lines((1:n), pu, col='green');
>pu=mteor-sqrt((1-p)/((1:n)*(p*p)*(1-0.95))); lines((1:n), pu, col='green');
Графический результат для объёма выборки n = 15000 приведён на рис. 5. На его основании можно утверждать, что с увеличением объёма выборки выборочная оценка математического ожидания стремится по вероятности к теоретическому математическому ожиданию распределения.
Для реализации решения задачи статистического моделирования на ЭВМ дискретных случайных величин средствами языка программирования «R» на примере геометрического распределения были использованы следующие встроенные функции языка:
– runif(n) — моделирование n равномерно распределенных случайных величин от 0 до 1;
– floor(x) — служит для возврата целой части числа x;
– log(x) — вычисление натурального логарифма числа x;
– sqrt(x) — вычисление квадратного корня числа x;
– mean(x) — вычисление математического ожидания вектора х;
– var(x) — вычисление дисперсии вектора x;
– dgeom(x,p) — вычисление теоретической плотности распределения;
– pgeom(x,p) — вычисление теоретической функции распределения;
– rgeom(n,p) — моделирование n независимых случайных величин, распределенных по геометрическому закону.
Рис. 5. График сходимости выборочной оценки к параметру распределения, n=15000.
Литература:
- Лобач В. И. Имитационное и статистическое моделирование: Практикум для студентов мат. и экон. спец. / В. И. Лобач, В. П. Кирлица, В. И. Малюгин, С. Н. Сталевская. — Минск: БГУ, 2004. — 189 с.
- Харин Ю. С., Степанова М. Д. Практикум на ЭВМ по математической статистике. — Минск: Университетское, 1987. — 304 с.
- Хастингс Н., Пикок Дж. Справочник по статистическим распределениям. — М.: Статистика, 1980. — 95 с.
Похожие статьи
Статистическое моделирование на ЭВМ непрерывных случайных...
Графический результат для объёма выборки n = 2000 приведён на рис. 5. На его основании можно утверждать, что с увеличением объёма выборки выборочная оценка математического ожидания стремится по вероятности к теоретическому математическому ожиданию...
Шаблон Excel для проверки законов распределения данных...
В статье рассматривается процедура создания шаблона Excel и опыт его применения для автоматического построения гистограмм и кривых Гаусса по результатам данных экспериментальных наблюдений с одновременной оценкой согласия по критерию Пирсона в...
Вычисление статистических показателей с использованием...
При проведении экспериментов или опытов получаются случайные величины, появление которых предсказать невозможно, и они чаще всего подчиняются нормальному закону распределения (закону Гаусса).
Решение задач анализа и синтеза на имитационных моделях...
Приведено математическое описание случайной величины — длительности раскроя сырья на лесообрабатывающем станке. Значения случайной величины могут быть получены в результате статистических наблюдений в производственных условиях или на имитационных...
Оценка параметров распределения амплитуд в управляющих...
; . Здесь «теоретический» закон распределения случайной амплитуды будет иметь вид. , а теоретические вероятности попадания
Величина вероятности зависит от того, какое распределение вероятностей имеет случайная величина. На этом важном факте следует...
Особенности анализа характеристик видеотрафика в системе АМС
В большинстве случаев, поток характеризуется функцией распределения временных интервалов между соседними заявками.
Интерфейс основного окна программы состоит из трех блоков: панель с потоками, график и панель настройки отображение графика.
Математическое моделирование композитов по...
Если наиболее вероятным значением искомой величины A принять , то законом распределения случайных ошибок будет нормальный закон Гаусса с плотностью вероятностей. , где m — математическое ожидание
Технологии WolframAlpha в системе подготовки бакалавра...
Величина вероятности зависит от того, какое распределение вероятностей имеет случайная величина. На этом важном факте следует акцентировать внимание студентов и только после этого переходить к построению соответствующего вычислительного процесса.
Методы математической статистики в технических исследованиях
Для оценки близости эмпирического распределения к теоретическому, используется
В случае нормального распределения вероятность того, что случайная величина примет
- X7- отношение математического ожидания цензурированных случайных величин к...
Определение значимости угроз в модели угроз безопасности при...
Плотность распределения этой случайной величины имеет вид дельта-функции
График обратной функции распределения для модели с «жесткой» оценкой имеет вид
Величина вероятности зависит от того, какое распределение вероятностей имеет случайная величина.
Похожие статьи
Статистическое моделирование на ЭВМ непрерывных случайных...
Графический результат для объёма выборки n = 2000 приведён на рис. 5. На его основании можно утверждать, что с увеличением объёма выборки выборочная оценка математического ожидания стремится по вероятности к теоретическому математическому ожиданию...
Шаблон Excel для проверки законов распределения данных...
В статье рассматривается процедура создания шаблона Excel и опыт его применения для автоматического построения гистограмм и кривых Гаусса по результатам данных экспериментальных наблюдений с одновременной оценкой согласия по критерию Пирсона в...
Вычисление статистических показателей с использованием...
При проведении экспериментов или опытов получаются случайные величины, появление которых предсказать невозможно, и они чаще всего подчиняются нормальному закону распределения (закону Гаусса).
Решение задач анализа и синтеза на имитационных моделях...
Приведено математическое описание случайной величины — длительности раскроя сырья на лесообрабатывающем станке. Значения случайной величины могут быть получены в результате статистических наблюдений в производственных условиях или на имитационных...
Оценка параметров распределения амплитуд в управляющих...
; . Здесь «теоретический» закон распределения случайной амплитуды будет иметь вид. , а теоретические вероятности попадания
Величина вероятности зависит от того, какое распределение вероятностей имеет случайная величина. На этом важном факте следует...
Особенности анализа характеристик видеотрафика в системе АМС
В большинстве случаев, поток характеризуется функцией распределения временных интервалов между соседними заявками.
Интерфейс основного окна программы состоит из трех блоков: панель с потоками, график и панель настройки отображение графика.
Математическое моделирование композитов по...
Если наиболее вероятным значением искомой величины A принять , то законом распределения случайных ошибок будет нормальный закон Гаусса с плотностью вероятностей. , где m — математическое ожидание
Технологии WolframAlpha в системе подготовки бакалавра...
Величина вероятности зависит от того, какое распределение вероятностей имеет случайная величина. На этом важном факте следует акцентировать внимание студентов и только после этого переходить к построению соответствующего вычислительного процесса.
Методы математической статистики в технических исследованиях
Для оценки близости эмпирического распределения к теоретическому, используется
В случае нормального распределения вероятность того, что случайная величина примет
- X7- отношение математического ожидания цензурированных случайных величин к...
Определение значимости угроз в модели угроз безопасности при...
Плотность распределения этой случайной величины имеет вид дельта-функции
График обратной функции распределения для модели с «жесткой» оценкой имеет вид
Величина вероятности зависит от того, какое распределение вероятностей имеет случайная величина.