Selasa, 29 November 2022

Deret Waktu : Model Autoregressive AR(p)

Definisi Model Autoregressive AR(p)

Model autoregresif adalah model deret waktu stasioner yang memprediksi nilai masa depan berdasarkan nilai masa lalu. Misalnya, model autoregresif mungkin berusaha memprediksi harga saham di masa depan berdasarkan kinerja masa lalunya.

Model autoregresif beroperasi di bawah premis bahwa nilai masa lalu berpengaruh pada nilai saat ini, yang membuat teknik statistik populer untuk menganalisis alam, ekonomi, dan proses lain yang bervariasi dari waktu ke waktu. Model regresi berganda meramalkan suatu variabel menggunakan kombinasi prediktor linier, sedangkan model autoregresif menggunakan kombinasi nilai variabel masa lalu.

Proses autoregresif AR(p) adalah proses dinmana nilai saat ini didasarkan pada p nilai sebelumnya. Contohnya :Proses autoregresif AR(1) adalah proses di mana nilai saat ini didasarkan pada nilai sebelumnya, sedangkan proses AR(2) adalah proses di mana nilai saat ini didasarkan pada dua nilai sebelumnya. Proses AR(0) digunakan untuk derau putih (white noise) dan tidak memiliki ketergantungan di antara istilah-istilah tersebut.

Rumus Autoregresi AR(p)

Model Autoregresi secara umum ditulis sebagai berikut:

$y_{t} = \delta+ \phi_{1}y_{t-1} + \phi_{2}y_{t-2} + \dots + \phi_{p}y_{t-p} + \varepsilon_{t}$

dimana \(\epsilon_t\) adalah white noise ~WN(0,\(\sigma_{\epsilon}\))

  • Untuk AR(1) :\(-1 < \phi_1 < 1\)
  • Untuk AR(2) : \(-1 < \phi_2 < 1\) dan \(\phi_1+\phi_2 < 1\), serta \(\phi_2-\phi_1 < 1\)

Rata-rata dan Varians AR(p), E(\(Y_t\))

Karena Autoregresif merupakan model stasioner, sehingga nilai rata-rata dan varians \(Y_t\) konstan dan tidak bergatung pada waktu t

Rata-Rata AR(1) :

$E(Y_t)=E(Y_{t-1}=\dots=E(Y_{t-h})=\mu=\dfrac{\delta}{1-\phi_1}$

Varians AR(1):

\(Var(x_t) = \dfrac{\sigma^2_\epsilon}{1-\phi_1^2}\)

Kovarian AR(1):

\(Cov(Y_t,Y_{t±h})=\gamma_h=\dfrac{\delta}{1-\phi_1}\phi^h_1\)

Korelasi

\(\rho_h = \dfrac{\gamma_h}{\gamma_0}=\phi^h_1\)

Fungsi Autokorelasi ACF dan Autokorelasi Parsial PACF dari AR(p)

Pada Autoregressive AR(p) secara teoritis bentuk ACF berbentuk lag yang setiap bertambah lag nilai terus menurun dengan nilai \(\phi^h_1\).Sedangkan untuk PACF dari AR(p) benilai sebanyak p lag dan pada lag ke p+1 nilainya 0

Berikut contoh ACF dan PACF untuk AR(1), AR(2) dan AR(p)

Sabtu, 26 November 2022

Analisis Klaster (Cluster Analysis)

Pengertian Analisis Gerombol (Cluster Analysis)

Analisis klaster atau analisis gerombol adalah metode multivariat yang bertujuan untuk mengklasifikasikan sampel subjek (atau objek) berdasarkan seperangkat variabel terukur ke dalam sejumlah kelompok yang berbeda sedemikian rupa sehingga subjek yang serupa ditempatkan dalam kelompok yang sama. Contoh di mana ini dapat digunakan adalah di bidang psikiatri, di mana karakterisasi pasien berdasarkan kelompok gejala dapat berguna dalam mengidentifikasi bentuk terapi yang tepat. Dalam pemasaran, mungkin berguna untuk mengidentifikasi kelompok pelanggan potensial yang berbeda sehingga, misalnya, iklan dapat ditargetkan dengan tepat.

Kelemahan Analisis Klaster

Kelemahan dari analisis klaster atau gerombol adalah Analisis klaster tidak memiliki mekanisme untuk membedakan antara variabel yang relevan dan tidak relevan. Oleh karena itu pemilihan variabel yang dimasukkan dalam analisis klaster harus didukung oleh pertimbangan konseptual. Hal ini sangat penting karena klaster yang terbentuk bisa sangat bergantung pada variabel yang dimasukkan.

Pendekatan Analisis Klaster

Ada sejumlah metode berbeda yang dapat digunakan untuk melakukan analisis klaster; metode-metode ini dapat diklasifikasikan sebagai berikut:

Metode hirarkis

1. Metode agglomeratif, di mana subjek memulai dalam kelompoknya sendiri yang terpisah. Dua klaster yang 'terdekat' (paling mirip) kemudian digabungkan dan hal ini dilakukan secara berulang-ulang hingga semua subjek berada dalam satu klaster. Pada akhirnya, jumlah klaster yang optimal kemudian dipilih dari semua solusi klaster.

2. Metode pembagian, di mana semua subjek dimulai pada klaster yang sama dan strategi di atas diterapkan secara terbalik hingga setiap subjek berada dalam klaster yang terpisah. Metode agglomerative lebih sering digunakan daripada metode memecah belah.

Metode non-hierarkis (sering dikenal sebagai metode pengelompokan k-means)

Jenis data dan ukuran jarak

Data yang digunakan dalam analisis klaster dapat berupa interval, ordinal atau kategorikal. Namun, memiliki campuran berbagai jenis variabel akan membuat analisis menjadi lebih rumit. Ini karena dalam analisis kluster Anda perlu memiliki beberapa cara untuk mengukur jarak antara pengamatan dan jenis pengukuran yang digunakan akan bergantung pada jenis data yang Anda miliki.

Sejumlah ukuran berbeda telah diusulkan untuk mengukur 'jarak' untuk data biner dan kategorikal. Untuk detailnya lihat buku karya Everitt, Landau dan Leese. Pembaca juga dirujuk ke teks ini untuk perincian tentang apa yang harus dilakukan jika Anda memiliki campuran tipe data yang berbeda. Untuk data interval ukuran jarak yang paling umum digunakan adalah jarak Euclidean.

Euclidean Distance

Secara umum, jika Anda memiliki p variabel \(X_1,X_2,...,X_p\) diukur pada sampel n subjek, data pengamatan untuk subjek i dapat dilambangkan dengan \(x_{i1},x_{i2},...,x{ip}\) dan data pengamatan untuk subjek j oleh \(x_{j1},x_{j2},...,x_{jp}\). Jarak Euclidean antara kedua mata pelajaran ini diberikan oleh

$d_{ij}=\sqrt{(x_{i1}-x_{j1})^2+(x_{i2}-x_{j2})^2+...+(x_{ip}-x_{j1})^2}$

Saat menggunakan ukuran seperti jarak Euclidean, skala pengukuran variabel yang dipertimbangkan menjadi masalah, karena mengubah skala jelas akan mempengaruhi jarak antara subjek (misalnya perbedaan 10cm bisa menjadi perbedaan 100mm). Selain itu, jika satu variabel memiliki jangkauan yang jauh lebih luas dari yang lain maka variabel ini akan cenderung mendominasi. Misalnya, jika pengukuran tubuh dilakukan untuk sejumlah orang yang berbeda, kisaran (dalam mm) tinggi badan akan jauh lebih lebar daripada kisaran lingkar pergelangan tangan, katakanlah. Untuk mengatasi masalah ini, setiap variabel dapat distandarisasi (diubah menjadi skor-z). Namun, hal ini sendiri menimbulkan masalah karena cenderung mengurangi variabilitas (jarak) antar cluster. Hal ini terjadi karena jika variabel tertentu memisahkan pengamatan dengan baik maka, menurut definisi, ia akan memiliki varians yang besar (karena variabilitas antar cluster akan tinggi). Jika variabel ini dibakukan maka jarak antar cluster akan semakin berkurang. Terlepas dari masalah ini, banyak buku teks merekomendasikan standarisasi. Jika ragu, salah satu strateginya adalah melakukan analisis klaster dua kali — sekali tanpa standarisasi dan sekali dengan — untuk melihat berapa banyak perbedaan, jika ada, hal ini membuat klaster yang dihasilkan.

Metode Algoritma Hierarkis (Hierarchical agglomerative methods)

Dalam pendekatan analisis klaster ini ada sejumlah metode berbeda yang digunakan untuk menentukan klaster mana yang harus digabungkan pada setiap tahap. Metode utama dirangkum di bawah ini.

• Metode jarak terdekat (single linkage method).

Dalam metode ini jarak antara dua cluster didefinisikan sebagai jarak antara dua anggota atau tetangga terdekat. Metode ini relatif sederhana tetapi sering dikritik karena tidak memperhitungkan struktur cluster dan dapat mengakibatkan masalah yang disebut chaining dimana cluster menjadi panjang dan tidak teratur. Namun, ini lebih baik daripada metode lain ketika cluster alami tidak berbentuk bola atau elips.

• Metode jarak terjauh (metode Complete linkage).

Dalam hal ini jarak antara dua klaster didefinisikan sebagai jarak maksimum antar anggota yaitu jarak antara dua subjek yang jaraknya paling jauh. Metode ini cenderung menghasilkan cluster-cluster kompak dengan ukuran yang sama, tetapi untuk metode tetangga terdekat, tidak memperhitungkan struktur cluster. Ini juga cukup sensitif terhadap outlier.

• Metode jarak rata-rata (antar kelompok) (kadang-kadang disebut sebagai UPGMA).

Jarak antara dua klaster dihitung sebagai jarak rata-rata antara semua pasangan subjek dalam dua klaster. Ini dianggap sebagai metode yang cukup kuat.

• Metode sentroid.

Di sini centroid (nilai rata-rata untuk setiap variabel) dari setiap cluster dihitung dan jarak antar centroid digunakan. Cluster yang centroidnya paling dekat satu sama lain akan digabungkan. Metode ini juga cukup kuat.

• Metode Ward.

Dalam metode ini semua pasangan cluster yang mungkin digabungkan dan jumlah jarak kuadrat dalam setiap cluster dihitung. Ini kemudian dijumlahkan untuk semua cluster. Kombinasi yang memberikan jumlah kuadrat terendah dipilih. Metode ini cenderung menghasilkan cluster dengan ukuran yang kira-kira sama, yang tidak selalu diinginkan. Ini juga cukup sensitif terhadap outlier. Meskipun demikian, ini adalah salah satu metode yang paling populer, bersama dengan metode hubungan rata-rata.

Memilih jumlah cluster yang optimal

Sebagaimana dinyatakan di atas, setelah analisis klaster dilakukan, maka perlu untuk memilih solusi klaster 'terbaik'. Ada beberapa cara untuk melakukannya, beberapa agak informal dan subyektif, dan beberapa lebih formal. Metode yang lebih formal tidak akan dibahas dalam handout ini. Di bawah ini, salah satu metode informal dijelaskan secara singkat.

Saat melakukan analisis klaster hierarkis, prosesnya dapat direpresentasikan dalam diagram yang dikenal sebagai dendrogram. Diagram ini menggambarkan cluster mana saja yang telah tergabung pada setiap tahapan analisis dan jarak antar cluster pada saat bergabung. Jika terjadi lompatan besar jarak antar cluster dari satu stage ke stage lainnya maka hal ini menunjukkan bahwa pada satu stage cluster yang relatif berdekatan akan bergabung sedangkan pada stage berikutnya cluster yang tergabung relatif berjauhan. Ini menyiratkan bahwa jumlah cluster yang optimal mungkin adalah jumlah yang ada tepat sebelum lompatan besar dalam jarak itu. Ini lebih mudah dipahami dengan benar-benar melihat dendrogram.

Metode pengelompokan non-hierarkis atau k-means

Dalam metode ini jumlah klaster yang diinginkan ditentukan terlebih dahulu dan solusi 'terbaik' dipilih. Langkah-langkah dalam metode tersebut adalah sebagai berikut:

1. Memilih pusat klaster awal (intinya ini adalah kumpulan pengamatan yang berjauhan setiap subjek membentuk klaster satu dan pusatnya adalah nilai variabel untuk subjek itu).

2. Tetapkan setiap subjek ke cluster 'terdekatnya', yang ditentukan dalam jarak ke pusat massa.

3. Temukan centroid dari cluster yang telah terbentuk

4. Hitung kembali jarak setiap subjek ke setiap centroid dan pindahkan pengamatan yang tidak berada di cluster yang paling dekat dengannya.

5. Lanjutkan sampai centroid relatif stabil.

Analisis klaster non-hierarkis cenderung digunakan ketika kumpulan data besar dilibatkan. Kadang-kadang lebih disukai karena memungkinkan subjek untuk berpindah dari satu klaster ke klaster lainnya (ini tidak mungkin dalam analisis klaster hierarkis di mana subjek, setelah ditetapkan, tidak dapat berpindah ke klaster yang berbeda). Dua kelemahan dari analisis klaster non-hierarkis adalah: (1) seringkali sulit untuk mengetahui berapa banyak klaster yang mungkin Anda miliki dan oleh karena itu analisis mungkin harus diulang beberapa kali dan (2) sangat sensitif terhadap pilihan. dari pusat cluster awal. Sekali lagi, mungkin ada baiknya mencoba yang berbeda untuk melihat apa dampaknya.

Salah satu strategi yang mungkin untuk diadopsi adalah dengan menggunakan pendekatan hierarkis pada awalnya untuk menentukan berapa banyak klaster yang ada dalam data dan kemudian menggunakan pusat klaster yang diperoleh dari ini sebagai pusat klaster awal dalam metode non-hierarkis.

Minggu, 13 November 2022

Cara Melakukan Analisis Komponen Utama (AKU) atau Principal Component Analysis (PCA) di Minitab

Dalam analisis peubah banyak salah satu metode yang digunakan adalah Analisis Komponen Utama (AKU) atau Principal Component Analysis (PCA). Analisis komponen utama dapat dilakukan menggunakan software analisi salah satunya minitab. Berikut akan diberikan contoh analisis komponen utama menggunakan minitab.

Data Minitab Tentang tingkat kesejahteraan masyarakat di Indonesia ▼
Provinsi X_1 X_2 X_3 X_4 X_5 X_6 X_7 X_8 X_9 X_10
Aceh 2,41 71 37,29 59,29 3,42 37 68 51,1 32,6 15,6
S. Utara 1,62 159 37,52 40,96 3,44 45 66 62,5 36,6 23,2
S. Barat 1,57 88 34,75 60,38 4,87 60 62 60,7 32,8 19,7
Riau 3,38 43 36,45 61,04 2,51 39 67 52,2 31,6 13,9
Jambi 3,24 55 35,84 6164 2,52 45 66 64,4 26,9 10,2
S.Selatan 2,69 71 36,87 60,03 3,1 54 64 62,8 26,1 15
Bengkulu 3,63 69 36,24 60,99 2,88 60 62 74,1 27,6 12,9
Lampung 2,04 204 36,16 60,58 3,26 48 65 69,8 22,6 10,8
Jakarta 1,99 15833 29,07 68,86 2,06 22 72 70,9 57,2 56
Jabar 2,07 866 33,7 62,4 3,91 56 63 66,4 27,1 22,9
Jateng 0,78 874 31,1 63,14 5,75 39 67 65,3 22 13,6
Yogya 0,03 920 24,24 67,6 8,16 23 72 78,1 41,1 25,3
Jatim 0,81 712 27,96 66,33 5,71 56 63 64,7 23,5 12,9
Bali 0,83 536 26,82 67,58 5,6 34 69 77,3 30,9 18,2
NTB 1,59 184 38,21 58,32 3,47 101 54 56 20 7
NTT 1,82 76 37,29 58,52 4,19 59 63 50,4 17 7
Banten 2,34 58 42,48 55,65 1,87 73 59 52,6 16,7 9,6
Kalbar 2,4 25 37,07 60,12 2,82 57 63 49,7 21,2 9
Kalteng 3,11 11 36,7 60,81 2,49 34 68 58,4 27,8 36,7
Kalsel 2,18 78 32,29 64,4 3,31 78 58 62,6 25,6 14,2
Kaltim 4,28 12 33,14 64,68 2,18 46 66 67,5 37 20,9
Sulut 1,34 141 30,71 64,95 4,34 441 67 66,3 35,8 20,8
Sulteng 2,52 29 36,84 60,82 2,7 72 60 60 28,2 11,3
Sulsel 1,6 106 34,36 61,64 4 56 63 60,2 29,2 14,6
Sultra 3,29 59 40,18 57,28 2,54 55 63 67,2 30,2 9,5
Maluku 2,35 29 38,2 58,43 3,36 58 63 59,3 31,7 11,7
Papua 3,33 5 38,91 59,9 1,19 58 63 60,8 23,8 11
Langkah-Langkah Melakukan Analisisi Komponen Utama (AKU) atau Principal Component Analysis (PCA)

1. Masukan data kedalam minitab

2. Klik menu Stat ➝ Multivariate ➝ Principal Component

3.a. Pada kotak Principal Component Analysis masukan kolom variabel x_1 sampai x_10 dan atur tipe matriks "correlation" jika skala data tiap variabel berbeda dan tipe matriks "Covariance" jika skala data tiap variabel seragam.

3.b. Jika ingin membuat plot data kedalam 2 komponen utama pertama pada box Principal Component Analysis klik graphs lalu centang "score plot for first 2 component"

Sehingga akan muncul hasil berupa eigenvalue dan eigenvector serta plot dari pca seperti dibawah:

State Space dan Parameter Space dalam Proses Stokastik

Proses stokastik, juga dikenal sebagai proses acak, adalah kumpulan variabel acak yang diindeks oleh beberapa himpunan matematika. Setiap probabilitas dan proses acak secara unik terkait dengan elemen dalam himpunan. Himpunan indeks adalah himpunan yang digunakan untuk mengindeks variabel acak. Himpunan indeks secara tradisional merupakan subset dari garis nyata, seperti bilangan asli, yang menyediakan set indeks dengan interpretasi waktu.

Proses stokastik secara praktis merupakan fungsi dari dua variabel waktu (elemen dari himpunan indeks) dan peristiwa (titik dalam ruang sampel yang tersirat oleh himpunan variabel acak).

Setiap variabel acak dalam kumpulan nilai diambil dari ruang matematika yang sama, yang dikenal sebagai ruang keadaan (state space). Ruang-keadaan ini bisa berupa bilangan bulat, garis nyata, atau ruang Euclidean berdimensi η, misalnya. Kenaikan proses stokastik adalah jumlah perubahan proses stokastik antara dua nilai indeks, yang sering diinterpretasikan sebagai dua titik waktu.

Proses stokastik adalah kumpulan atau kemungkinan variabel acak yang diindeks oleh parameter t, biasanya mewakili waktu.

State Space (Ruang Kejadian)

State Space atau ruang kejadian adalah kisaran kemungkinan hasil kejadian variabel random pada proses stokastik. Berdasarkan variaber random nya state space dapat dibagi menjadi diskrit dan kontinu

variabel acak diskrit adalah variabel yang dapat mengambil hanya sejumlah nilai yang berbeda yang dapat dihitung seperti 0,1,2,3,4,........ Variabel acak diskrit biasanya (tetapi tidak harus) dihitung. Jika variabel acak hanya dapat mengambil sejumlah nilai yang berbeda, maka itu harus diskrit. Contoh variabel acak diskrit meliputi jumlah anak dalam sebuah keluarga, kehadiran di bioskop pada Jumat malam, jumlah pasien di ruang operasi dokter, jumlah bola lampu yang rusak dalam kotak berisi sepuluh.

variabel acak kontinu adalah variabel yang mengambil jumlah nilai yang mungkin tak terbatas. Variabel acak kontinu biasanya pengukuran. Contohnya termasuk tinggi badan, berat badan, jumlah gula dalam jeruk, waktu yang dibutuhkan untuk berlari satu mil.


Parameter Space

Parameter Space adalah variabel indeks dalam hal ini waktu (t) yang digunakan dalam proses stokastik.

Proses stokastik dengan parameter (“waktu”) kontinu jika T merupakan suatu interval dengan panjang positif. Proses stokastik dengan parameter (“waktu”) diskret jika T merupakan himpunan bagian dari suatu bilangan bulat.

Dalam proses stokastik, Ruang State S dari proses tersebut memiliki 4 kemungkinan, yaitu :

  1. Proses stokastik dengan parameter diskret, dapat menghasilkan ruang state diskret.
  2. Proses stokastik dengan prameter diskret, dapat menghasilkan ruang state kontinu.
  3. Proses stokastik dengan parameter kontinu, menghasilkan ruang state diskret.
  4. Proses stokastik dengan parameter kontinu, menghasilkan ruang state kontinu.

Sabtu, 12 November 2022

Cara Standarisasi Skala Interval Data

Standardisasi muncul ketika fitur dari kumpulan data input memiliki perbedaan besar antara rentangnya, atau hanya ketika mereka diukur dalam unit yang berbeda (misalnya, pound, meter, mil, dll.).

Misalnya, Variabel yang berkisar antara 0 dan 1000 akan lebih besar daripada variabel yang berkisar antara 0 dan 1. Menggunakan variabel-variabel ini tanpa standarisasi akan memberikan variabel dengan rentang bobot yang lebih besar dari 1000 dalam analisis. Mengubah data ke skala yang sebanding dapat mencegah masalah ini. Prosedur standarisasi data yang khas menyamakan kisaran dan/atau variabilitas data.

Standardisasi mengasumsikan bahwa data Anda memiliki distribusi Gaussian (kurva lonceng). Ini tidak sepenuhnya harus benar, tetapi teknik ini lebih efektif jika distribusi atribut Anda adalah Gaussian. Standardisasi berguna ketika data Anda memiliki skala yang bervariasi dan algoritme yang Anda gunakan membuat asumsi tentang data Anda yang memiliki distribusi Gaussian, seperti regresi linier , regresi logistik, dan analisis diskriminan linier.

Cara Melakukan Standarisasi Skala Data

Standarisasi dapat dilakukan dengan mengurangi data dengan mean rata-rata lalu membaginya dengan standar deviasi

$z=\frac{x-\mu}{\sigma}$

Jumat, 11 November 2022

Interpretasi Probabilitas

Selain banyak aplikasi formal teori probabilitas, konsep probabilitas memasuki kehidupan dan percakapan kita sehari-hari. Kita sering mendengar dan menggunakan ungkapan seperti "Besok siang mungkin akan hujan", "Kemungkinan besar pesawat akan tiba terlambat", atau "Kemungkinan besar dia bisa bergabung dengan kita untuk makan malam malam ini". Masing-masing ekspresi ini didasarkan pada konsep probabilitas, atau kemungkinan, bahwa beberapa peristiwa tertentu akan terjadi.

Terlepas dari kenyataan bahwa konsep probabilitas adalah bagian yang umum dan alami dari pengalaman kita, tidak ada interpretasi ilmiah tunggal dari istilah probabilitas yang diterima oleh semua ahli statistik, filsuf, dan otoritas lainnya. Selama bertahun-tahun, setiap interpretasi probabilitas yang diajukan oleh beberapa otoritas telah dikritik oleh yang lain. Memang, makna probabilitas yang sebenarnya masih menjadi subjek yang sangat kontroversial dan terlibat dalam banyak diskusi filosofis saat ini yang berkaitan dengan dasar-dasar statistik. Tiga interpretasi probabilitas yang berbeda akan dijelaskan di sini. Masing-masing interpretasi ini bisa sangat berguna dalam menerapkan teori probabilitas pada masalah-masalah praktis.

Interpretasi Frekuensi ▼

Interpretasi frekuensi probabilitas adalah yang paling banyak dipegang dari beberapa cara interpretasi makna konsep "probabilitas". Menurut interpretasi ini probabilitas suatu peristiwa adalah proporsi banyak suatu peristiwa terjadi ketika percobaan dilakukan dalam jumlah yang sangat besar.

Sebagai contoh, peluang mendapatkan muka pada saat koin dilemparkan dianggap 1/2 karena frekuensi relatif muka muncul adalah 1/2 apabila dilemparkan dalam jumlah yang besar dalam kondisi yang serupa.

Moore et al. (2009) memberikan beberapa contoh pelemparan koin yang dilakukan oleh beberapa tokoh terkenal. Count Buffon (1707–1788), seorang naturalis dari Perancis, melemparkan sebuah mata koin sebanyak 4.040 kali dan muka muncul sebanyak 2048 kali atau proporsi kemunculan muka 2.048/4.040 = 0,5069. Kemudian sekitar tahun 1900, statistikawan Inggris Karl Pearson melemparkan koin sebanyak 24.000 kali dan hasilnya muka muncul sebanyak 12.012 atau proporsinya 0,5005. Kemudian, statistikawan Afrika Selatan John Kerrich saat dipenjara selama Perang Dunia Kedua melemparkan koin sebanyak 10.000 kali dan hasilnya muka muncul sebanyak 5.067 kali atau proporsi kemunculan 0,5067.

Interpretasi peluang dalam frekuensi memiliki beberapa kelemahan. Pertama, bilangan yang cukup besar ini sulit dijelaskan. Kedua, "kondisi serupa" ini juga tidak dapat dijelaskan dengan tepat. Ketiga, banyak masalah penting tidak memiliki interpretasi frekuensi, misalnya peluang seseorang akan menikah dalam beberapa tahun ke depan atau penelitian dalam bidang kedokteran yang akan menghasilkan perlakuan baru untuk penyakit tertentu dalam waktu tertentu.

Kelemahan lain dari interpretasi frekuensi probabilitas adalah bahwa itu hanya berlaku untuk masalah di mana mungkin ada, setidaknya secara prinsip, sejumlah besar pengulangan proses tertentu yang serupa. Banyak masalah penting bukan dari jenis ini. Misalnya, interpretasi frekuensi probabilitas tidak dapat diterapkan secara langsung pada probabilitas bahwa seorang kenalan tertentu akan menikah dalam dua tahun ke depan atau probabilitas bahwa proyek penelitian medis tertentu akan mengarah pada pengembangan pengobatan baru untuk penyakit tertentu. dengan dalam jangka waktu tertentu

Interpretasi peluang ini disebut pula a posteriori

Interpretasi Klasik ▼

Interpretasi klasik didasarkan pada konsep kemungkinan hasil yang sama. Misalnya, ketika koin dilempar, ada dua kemungkinan hasil: kepala atau ekor. Jika dapat diasumsikan bahwa hasil ini sama-sama mungkin terjadi, maka mereka harus memiliki probabilitas yang sama. Karena jumlah probabilitas harus 1, probabilitas kepala dan probabilitas ekor harus 1/2. Secara lebih umum, jika hasil dari suatu proses harus merupakan salah satu dari n hasil yang berbeda, dan jika n hasil ini memiliki kemungkinan yang sama untuk terjadi, maka probabilitas setiap hasil adalah 1/n.

Dua kesulitan dasar muncul ketika upaya dilakukan untuk mengembangkan definisi formal probabilitas dari interpretasi klasik. Pertama, konsep kemungkinan hasil yang sama pada dasarnya didasarkan pada konsep probabilitas yang kita coba definisikan. Pernyataan bahwa dua hasil yang mungkin sama-sama mungkin terjadi adalah sama dengan pernyataan bahwa dua hasil memiliki probabilitas yang sama. Kedua, tidak ada metode sistematis yang diberikan untuk menetapkan probabilitas pada hasil yang tidak diasumsikan memiliki kemungkinan yang sama (equally likely). Ketika koin dilempar, atau dadu yang seimbang digulung, atau kardi dipilih dari setumpuk kartu yang dikocok dengan baik, kemungkinan hasil yang berbeda biasanya dapat dianggap sama kemungkinannya karena sifat prosesnya. Namun, ketika masalahnya adalah menebak apakah seorang kenalan akan menikah atau apakah sebuah proyek penelitian akan berhasil, hasil yang mungkin biasanya tidak dianggap memiliki kemungkinan yang sama, dan diperlukan metode yang berbeda untuk menetapkan probabilitas pada hasil ini.

Interpretasi peluang ini disebut juga a priori

Interpretasi Subjektif ▼

Menurut subjektif, atau pribadi, probabilitas bahwa seseorang menetapkan hasil yang mungkin dari beberapa proses mewakili penilaiannya sendiri tentang kemungkinan hasil yang akan diperoleh. Penilaian ini akan didasarkan pada keyakinan dan informasi setiap orang tentang proses tersebut. Orang lain, yang mungkin memiliki keyakinan yang berbeda atau informasi yang berbeda, dapat memberikan kemungkinan yang berbeda untuk hasil yang sama. Untuk alasan ini, adalah tepat untuk berbicara tentang probabilitas subjektif orang tertentu dari suatu hasil, daripada berbicara tentang probabilitas sebenarnya dari hasil itu.

Interpretasi subjektif dari probabilitas ini dapat diformalkan. Secara umum, jika penilaian orang tentang kemungkinan relatif dari berbagai kombinasi hasil memenuhi kondisi konsistensi tertentu, maka dapat ditunjukkan bahwa probabilitas subjektif mereka dari kemungkinan kejadian yang berbeda dapat ditentukan secara unik. Namun, ada dua kesulitan dengan interpretasi subyektif. Pertama, persyaratan penilaian seseorang tentang kemungkinan relatif dari sejumlah peristiwa yang tak terbatas benar-benar konsisten dan bebas dari kontradiksi tampaknya tidak dapat dicapai secara manusiawi, kecuali jika seseorang hanya bersedia mengadopsi kumpulan penilaian yang diketahui konsisten. Kedua, interpretasi subyektif tidak memberikan dasar "obyektif" bagi dua atau lebih ilmuwan yang bekerja sama untuk mencapai evaluasi bersama tentang keadaan pengetahuan di beberapa bidang ilmiah yang diminati bersama.

Di sisi lain, pengenalan interpretasi subyektif dari probabilitas memiliki efek yang bermanfaat dengan menekankan beberapa aspek subyektif ilmu pengetahuan. Evaluasi seorang ilmuwan tertentu tentang kemungkinan hasil yang tidak pasti pada akhirnya harus menjadi evaluasi orang itu sendiri berdasarkan semua bukti yang tersedia. Evaluasi ini mungkin sebagian didasarkan pada interpretasi frekuensi probabilitas, karena ilmuwan dapat memperhitungkan frekuensi relatif kejadian dari hasil ini atau hasil serupa di masa lalu. Ini mungkin juga didasarkan sebagian pada interpretasi klasik probabilitas, karena ilmuwan dapat memperhitungkan jumlah total kemungkinan hasil yang dianggap sama kemungkinannya untuk terjadi. Namun demikian, tugas akhir probabilitas numerik adalah tanggung jawab ilmuwan itu sendiri.

Sifat subyektif sains juga terungkap dalam masalah aktual yang dipilih oleh ilmuwan tertentu untuk dipelajari dari kelas masalah yang mungkin telah dipilih, dalam eksperimen yang dipilih dalam melaksanakan studi ini, dan dalam kesimpulan yang ditarik dari eksperimen tersebut. data. Teori matematika probabilitas dan statistik dapat memainkan peran penting dalam pilihan, keputusan, dan kesimpulan ini.

Selasa, 08 November 2022

Model Matematika Predator Prey

Dalam suatu habitat pasti ada spesies yang memakan spesies lainnya yaitu. Spesies yang memakan spesies lain disebut predator (P) atau pemangsa dan spesies yang dimakan disebut prey atau mangsa (M). Dalam pemodelannya populasi pemangsa akan tumbuh jika dan hanya jika pemangsa tersebut memakan mangsanya, sehingga pertumbuhan pemangsa dapat ditulis dengan cPM dimana c adalah pertumbuhan pemangsa akibat interaksi dengan (memakan) mangsa.

Selain itu populasi pemangsa akan berkurang karena kematian alami dPDilain sisi pemangsa yang tumbuh secara konstan aM akan mengalami penurunan populasi akibat interaksi (dimakan) dengan pemangsanya . Sehingga penurunan populasi ini dapat ditulis bPM dimana b adalah konstanta positif perurunan populasi akibat interaksi mangsa dan pemangsa.

Dari pernyataan diatas kemudian dapat dicari persamaan laju pertumbuhan antara populasi Pemangsa / Predator (P) dan populasi Mangsa/Prey (M) sebagai berikut:

$\begin{aligned}\frac{dM}{dt}&=aM-bPM\\\frac{dP}{dt}&=cPM-dP\end{aligned}$



Dalam suatu habitat tertutup, ketersediaan ruang dan makanan sangatlah terbatas. Keterbatasan ruang dan makanan ini mengakibatkan mangsa dan pemangsa memiliki kapasitas maksimal agar terjaminnya keseimbangan populasi dengan habitatnya.

Misalkan \(K_P\)  adalah kapasitas maksimal populasi predator dan adalah \(K_M\) kapasitas maksimal populasi mangsa. Sehingga dapat dicari ruang pertumbuhan untuk pemangsa dan mangsa, yaitu \(\big(1-\frac{M}{K_M}\big)\) ruang pertumbuhan untuk mangsa dan \(\big(1-\frac{P}{K_P}\big)\)ruang pertumbuhan untuk pemangsa. Selanjutnya dengan masukan kedua ruang pertumbuhan kedalam persamaan sebelumnya didapat persamaan

$\begin{aligned}\frac{dM}{dt}&=aM\big(1-\frac{M}{K_M}\big)-bPM\\\frac{dP}{dt}&=cPM\big(1-\frac{P}{K_P}\big)-dP\end{aligned}$

Model Matematika Pertumbuhan Populasi dengan Kompetisi Antar Spesies

Kelajuan Pertumbuhan Dua atau Lebih Kompetitor, Diberikan beberapa populasi yang memiliki laju pertumbuhan yang terpisah.

$\frac{dP_1}{dt}=r_1 P_1\big(1-\frac{P_1}{K_1}\big)$
$\frac{dP_2}{dt}=r_2 P_2\big(1-\frac{P_2}{K_2}\big)$
Sampai ke populasi n
$\frac{dP_n}{dt}=r_n P_n\big(1-\frac{P_n}{K_n}\big)$

Kemudian kita tahu pada suatu habitat mungkin saja ada dua atau lebih spesies yang hidup dengan sumber makanan yang sama. Karena spesies-spesies tersebut memakan sumber makanan yang sama, ini membuat mereka harus berbagi sumber makanan sehingga persediaan makanan untuk setiap spesies menjadi berkurang. Oleh karena itu dapat disimpulkan setiap spesies akan mempengaruhi kapasitas populasi spesies lain yang memiliki sumber makanan yang sama.

Spesies yang memiliki sumber makanan sama dapat dianggap dalam 1 kelompok sama. Hal yang membedakan setiap spesies dalam kelompok tersebut adalah porsi makan spesies tersebut.

Misalkan dua populasi P1 dan P2 memiliki perbandingan porsi makan tetap.
$P_1 : P_2 = k_1:k_2$
$P_1= \frac{k_1}{k_2}P_2$
$P_2=\frac{k_2}{k_1} P_1$

Dari perbandingan tersebut didapat
$\frac{k_1}{k_2}  = a_{12}$
$\frac{k_2}{k_1}  = a_{21}$
Kedua populasi tersebut kemudian ditambahkan pada masing-masing populasi lainnya sebagai anggota tambahan pada laju pertumbuhan. Sehingga didapat laju pertumbuhan kedua populasi sebagai berikut:

$\frac{dP_1}{dt}=r_1 P_1\big(1-\frac{P_1+a_{12}P_2}{K_1}\big)$
$\frac{dP_2}{dt}=r_2 P_2\big(1-\frac{P_2+a_{21}P_1}{K_2}\big)$

Terdapat 2 kondisi yang akan terjadi selama t waktu pada kedua spesies yaitu : 
1. terjadinya kesetimbangan populasi dimana kedua populasi ada dan mencapai kondisi setimbang dengan \(P_1+a_{12}P_2=K_1\) dan \(P_2+a_{21}P_1=K2\)



2. Salah satu spesies punah karena salah satu kapasitas spesies sudah penuh tetapi kapasitas spesies lainnya belum ( \(P_1+a_{12}P_2=K_1\) dan \(\P_2+a_{21}P_1<K_2\) atau \(P_1+a_{12}P_2<K_1\) dan \(\frac{P_2+a_{21}P_1=K2\)) . Hal ini akan membuat spesies yang sudah mencapai kapasitasnya menjadi overload karena bertambahnya spesies lain yang mempengaruhi kapasitas spesies tersebut sehingga spesies tersebut mengalami penurunan populasi. 
Contohnya jika populasi \(P_1+a_{12}P_2<K_1\) dan \(P_2+a_{21}P_1=K2\)


Kamis, 03 November 2022

Model Matematika Kelajuan Pertumbuhan Exponensial dan Logistik Populasi Suatu Spesies

Kelajuan adalah perubahan posisi titik terhadap satuan waktu. Diberikan suatu fungsi sembarang f(t) berada pada titik t kemudian dari titik t bergeser kesamping sebanyak h sehingga posisi titik berada pada f(t+h). Sehingga dapat dicari kelajuan fungsi f dari t menuju h dengan persamaan.

$v(t)=\frac{f(t+h)-f(t)}{h}$

Untuk mencari kelajuan di pada waktu kontinu, kita asumsikan \(h\) mendekati nilai 0 \(( h\rightarrow 0 )\) tapi tidak sama dengan 0 (h ≠ 0), sehingga didapat persamaan kelajuan populasi

$\begin{aligned}\lim_{t \to 0} v(t )&=\lim_{t \to 0} \frac{f(t+h)-f(t)}{h}\\&=f'(t)\\&=\frac{df}{dt}\end{aligned}$

Jadi dapat disimpulkan kelajuan pertumbuhan populasi merupakan suatu turunan pertama atau persamaan diferensial orde 1 sehingga untuk mencari nilai \(f(t)\) pada titik t perlu dicari penyelesaian diferensial terlebih dahulu .

Kelajuan Pertumbuhan Exponensial  Tanpa Batasan

Misalkan suatu habitat hanya berisi 1 spesies P saja dengan kelajuan pertumbuhan konstan yang dapat ditulis dengan persamaan.

$\frac{dP}{dt}=rP$

Dimana dP/dt adalah kelajuan pertumbuhan konstan dari fungsi pertumbuhan P(t) pada waktu kontinu dan r adalah konstanta rata-rata pertumbuhan populasi dan P adalah populasi spesies. Dengan menyelesaikan persamaan diferensial diatas kita dapat menemukan jumlah populasi spesies terhadap waktu (t) dapat dicari dengan rumus

$\begin{aligned}\frac{1}{P}dP&=r dt\\\int\frac{1}{P}dP&=\int r dt\\ln(P)&=rt\\P(t)&=Ce^{rt}\end{aligned}$

Kemudian kita misalkan populasi awal pada t=0 adalah \(P_0\) sehingga dapat ditulis \(P(0)=P_0\). Sehingga kita dapat cari nilai dari C

$\begin{aligned}P(0)&=Ce^{r0}\\P_0&=C\end{aligned}$

Dengan diketahui nilai C kita dapat menulis fungsi pertumbuhan populasi P dengan
$P(t)=P_0 e^{rt}$


Kelajuan Pertumbuhan Logistik dengan Kapasitas Maksimal Populasi

Selanjutnya jika suatu spesies hidup dalam habitat tertutup yang mengakibatkan sumber makanan menjadi terbatas hanya pada habitat tersebut. Keterbatasan makanan inilah yang kemudian membatasi populasi suatu spesies sehingga suatu spesies memiliki kapasitas maksimal untuk suatu habitat.

Misalkan K adalah kapasitas maksimal suatu populasi dan P adalah jumlah populasi. Kita dapat menghitung ketersediaan ruang pertumbuhan dengan \(\big(1-\frac{P}{K}\big)\). Ketersediaan ruang pertumbuhan ini kemudian mempengaruhi laju pertumbuhan yang dapat ditulis, sebagai berikut

$\frac{dP}{dt}=rP\Big(1-\frac{P}{K}\Big)$

Pada awalnya P cukup kecil yang mengakibatkan \(\big(1-\frac{P}{K}\big)\ mendekati 1 sehingga tidak mempengaruhi laju pertumbuhan, tetapi seiring waktu jumlah populasi P akan meningkat menyebabkan 1-PK semakin kecil sehingga laju pertumbuhan akan semakin melambat.

Misalkan suatu waktu \(P>K\), \(\big(1-\frac{P}{K}\big)\) akan bernilai negatif yang mengakibatkan penurunan populasi hingga tercapainya kondisi \(P<K \) yang membuat peningkatan kembali jumlah populasi.


Dari persamaan laju pertumbuhan tersebut, kemudian akan dicari fungsi untuk jumlah populasi dengan menyelesaikan persamaan diferensial diatas, sehingga didapat persamaan :

$P(t)=\frac{P_0 Ke^{rt}}{K-P_0\big(1-e^{rt}\big)}$


Rabu, 02 November 2022

Metode Momen Penduga Distribusi Chi Square

 Misalkan \(X_1,X_2,...,X_n\) peubah acak saling bebas dan berdistribusi chi square \(\chi^2\)dengan parameter rata-rata \(k\) dan varians \(2k\). Tentuka estimator penduga parameter untuk \(k\).


$\chi^2=\frac{1}{2^{k/2}\Gamma(k/2) }x^{k/2-1}e^{-x/2}$


Pertama perlu dicari Momen populasi untuk log normal, yaitu :

$\begin{aligned}\mu'_1&=E(X)\\&=k\end{aligned}$


Selanjutnya akan dicari momen sampel

$M_1=\frac{1}{n}\sum{x_i}=\bar{x}$


Selanjutnya akan disamakan untuk momen populasi dan sampel yang bersesuaian

$\begin{aligned}\mu'_1&=M_1\\k&=\bar{x}\end{aligned}$