Showing posts with label R Programming. Show all posts
Showing posts with label R Programming. Show all posts

STATISTIKA R PROGRAMMING

Untuk mencari Rata-Rata, Median, Modus, Quartil, Desil, Persentil pada data berkelompok, sebelumnya kita harus mengetahui jumlah kelas, interval, serta membuat tabel terlebih dahulu agar dapat mencari Quartil, Desil, Persentil. Sama sesi kita pada postingan yang lalu sebelumnya cari data-data yang dibutuhkan terlebih dahulu antara lain sebagai berikut:

Mencari Jumlah Kelas dan Interval Data


Logika Program :
jumlah_kelas=1+3.322*log10((length(data))) Artinya variable jumlah_kelas diberi nilai jumlah data dikalikan log 10 kemudian dikalikan 3,322 kemudian dijumlahkan dengan 1 . (Rumus Sturges)

interval=range/jumlah_kelas Artinya variable interval diberi nilai variable range (yang telah diproses hasilnya sebelumnya) dibagi jumlah_kelas (yang telah diproses dan dibulatkan hasilnya sebelumnya)
Sehingga di dapatkan Jumlah Kelas=5 dan Interval=3

Mencari Mean atau Titik Tengah Pada Setiap Kelas


Logika Program:
Setelah mengetahui interval , selanjutnya kita bisa mengetahui titik tengah dari masing-masing setiap kelas dengan menggunakan syntax mean.Di bawah ini sebagai contoh kita ambil kelas pertama yang dimulai dari nilai data 9.

mean(9:11) Artinya menampilkan titik tengah antara nilai 9 dan 11, jika secara manual si user akan memproses 9ditambah 11 dibagi 2 yaitu 10.
Lanjutkan syntax mean pada kelas-kelas berikutnya, sehingga masing-masing kelas dapat diketahui titik tengahnya sampai dengan kelas terakhir yaitu 21 – 23.
Sehingga didapat nilai titik tengah pada masing-masing kelas :
Kelas1: 10; Kelas2: 13; Kelas3: 16; Kelas4: 19; Kelas5: 22;

Mencari Frekuensi Data Pada Setiap Kelas



Logika Program :
Artinya variable frekuensi diberi function yang mempunyai variable penampung nilai yang nantinya akan dikembalikan ke nilai awal yaitu variable penampung x,y, dan z. Kemudian variable a dalam function diberi nilai 0 setelah itu terdapat perulangan dimana variable pengontrol perulangan di sini adalah i dengan dimulai i=1 sampai dengan length(x) atau panjang dari x (nilai jumlah dari data), kemudian terdapat kondisi dimana data ke i jika lebih besar atau sama dengan y (batas awal kelas) dan data ke i masih kurang dari atau sama dengan variable z (batas akhir kelas) maka variable a diberi nilai a+1, kemudian cetak nilai dari variable a.
Setelah function frekuensi sukses dibuat maka saatnya menjalankan function tersebut dengan mengisikan nilai ke dalam variable yang ada pada function.
Sehingga didapat frekuensi data pada masing-masing kelas sebagai berikut:
Kelas1: 2; Kelas2: 8; Kelas3: 3; Kelas4: 2; Kelas5: 5

Membuat Tabel Dengan Data Batas Akhir Kelas, Titik Tengah, Frekuensi


STEP 1
Ketik tabel=edit(data.frame()) kemudian enter, setelah itu .Masukan Batas Kelas, Titik Tengah, Serta Frekuensi pada masing-masing kelas yang telah kita peroleh nilainya sebelumnya. Maka akan muncul tampilan layar data editor sbb:


STEP 2
Tutup Jendela Data Editor Table, selanjutnya untuk menampilkan table yang selesai kita buat pada R Console cukup dengan cara memanggil nama variable tabel kemudian enter, maka tampilan layar sebagai berikut:


Mencari Rata-Rata



Logika Program :


rata=sum(tabel$XiFi)/length(data)
Artinya : Variable rata diberi nilai operasi dari pengambilan nilai pada setiap data XiFi (Kolom baru yang baru kita buat dengan syntax tabel$nama_kolom_baru) dibagi jumlah keseluruhan data, Sehingga dapat diartikan bahwa isi dari kolom XiFi merupakan hasil kali dari nilai yang ada di kolom Xi dan isi nilai data dari kolom Fi.
Dengan Demikian Variable rata_rata mempunyai hasil Sum(tabel$XiFi)/length(data)=16

Mencari Median


Logika Program :


Dimana:
tbm : tepi batas kelas median yaitu jumlah data/2 (20/2=10) nilai data 10 ada dikelas 2 sehingga tepi batas kelas median dari kelas 2 (12-14) adalah 11.5
km : kelas median yaitu jumlah data/2 (20/2=10)
fkm: frekuensi kumulatif sebelum kelas median yaitu frekuensi sebelum 8 adalah 2
fm : frekuensi median yaitu 8
>median =tbm+interval *((km-fkm)/fm) Artinya Variable median diberi nilai nilai variable tbl(tepi batas kelas median) ditambah interval kelas dikalikan dengan selisih kelas median dikurangi frekuensi kumulatif kelas median dibagi frekuensi median sehingga didapat hasil nilai dari median yaitu 14.5

Mencari Modus


Logika Program :


Dimana:
tbm : tepi batas kelas median yaitu jumlah data/2 (20/2=10) nilai data 10 ada dikelas 2 sehingga tepi batas kelas median dari kelas 2 (12-14) adalah 11.5
d1 : frekuensi kelas median dikurangi frekuensi kelas sebelum kelas median yaitu 8-2=6
d2 : frekuensi kelas median dikurangi frekuensi kelas sesudah kelas median yaitu 8-3=5
>modus=tbm+interval*(d1/(d1+d2)) Artinya Variable modus diberi nilai variable tbm ditambah interval kemudian dikalikan dengan hasil variable d1 dibagi hasil dari d1 ditambah d2, sehingga didapat nilai dari modus yaitu 13.13636

Mencari Quartil


Logika Program :

Rumus Q1 = tbq1 +interval x (n/4-fkq1)/fq1)

Dimana:
tbq1 : tepi batas kelas quartil 1 yaitu jumlah data/4 (20/4=5) nilai data 5 ada dikelas 2 sehingga tepi batas kelas quartil dari kelas 2 (12-14) adalah 11.5
fq1 : frekuensi quartil 1 yaitu 20/4=5, nilai 5 ada di frekuensi ke 8
fkq1 : frekuensi kumulatif sebelum quartil 1 yaitu frekuensi sebelum 8 adalah 2
>Q1 =tbq1+interval *((length(data)/4-fkq1)/fq1) Artinya Variable Q1 diberi nilai variable tbql(tepi batas kelas quartil1) ditambah interval kelas dikalikan dengan selisih jumlah data yang dibagi empat dan frequensi kumlatif quartil pertama lalu dibagi frekuensi quartil 1. Sehingga didapat Quartil 1 yaitu 12.625


Rumus Q2 = tbq2 +interval x (n/2-fkq2)/fq2)

Dimana:
tbq2 : tepi batas kelas quartil 2 yaitu jumlah data/2 (20/2=10) nilai data 10 ada dikelas 2 sehingga tepi batas kelas quartil 2 dari kelas 2 (12-14) adalah 11.5
fq2 : frekuensi quartil 2 yaitu 20/2=10, nilai 10 ada di frekuensi ke 8
fkq2 : frekuensi kumulatif sebelum quartil 2 yaitu frekuensi sebelum 8 adalah 2
>Q2 =tbq2+interval *((length(data)/2-fkq2)/fq2) Artinya Variable Q2 diberi nilai variable tbql(tepi batas kelas quartil1) ditambah interval kelas dikalikan dengan selisih jumlah data yang dibagi 2 dan frequensi kumlatif quartil 2 lalu dibagi frekuensi quartil 2. Sehingga didapat Quartil 2 yaitu 14.5


Rumus Q3 = tbq3 +interval x (3n/4-fkq3)/fq3)

Dimana:
tbq3 : tepi batas kelas quartil 3 yaitu 3*(jumlah data/4) sehingga 60/4=15 nilai data 15 ada dikelas 4 sehingga tepi batas kelas quartil 3 dari kelas 4(18-20) adalah 17.5
fq3 : frekuensi quartil 3 yaitu 3*n/4=15, nilai 15 ada di frekuensi ke 2
fkq3 : frekuensi kumulatif sebelum quartil 3 yaitu frekuensi sebelum 2 adalah 13
>Q3 =tbq3+interval *((3*length(data)/3-fkq3)/fq3) Artinya Variable quartil 3 diberi nilai variable tbq3(tepi batas kelas quartil3) ditambah interval kelas dikalikan dengan selisih jumlah data yang dikalikan tiga lalu dibagi 4 dan frequensi kumlatif quartil 3 lalu dibagi frekuensi quartil 3. Sehingga didapat Quartil 3 yaitu 20.5


Mencari Desil


Logika Program :

Rumus Desil = tbd +interval x ((nilai_desil*n)-fkd)/fd)

Dimana:
nilai_desil merupakan nilai antara range 1-9 karena nilai tersebut berada pada desil (10)
tbd8 : tepi batas kelas desil yaitu 8*jumlah data/10 (160/10=16) nilai data 16 ada dikelas 5 sehingga tepi batas kelas desil 8 dari kelas 5 (21-23) adalah 20.5
fd8 : frekuensi desil yaitu 8*20/10=16, nilai 16 ada di frekuensi ke 5
fkd8 : frekuensi kumulatif sebelum desil 8 yaitu frekuensi sebelum 5 adalah 15
>D8 =tbd8+interval *(((8*length(data)/fkd8)/fd8) Artinya Variable D8 diberi nilai variable tbd8 ditambah interval dikali 8 (Karena mencari Desil ke-8) dikali jumlah data lalu dikurangi frekuensi kumulatif desil 8 kemudian dibagi fd8, Sehingga dihasilkan nilai D8 yaitu 107.5


Mencari Persentil


Logika Program :

Rumus Persentil = tbp +interval x ((nilai_persentil*n)-fkp)/fp)

Dimana:
nilai_desil merupakan nilai antara range 1-99 karena nilai tersebut berada pada desil (100)
tbp50 : tepi batas kelas persentil yaitu 50*jumlah data/10 (1000/10=10) nilai data 10 ada dikelas 2 sehingga tepi batas kelas persenti dari kelas 2 (12-14) adalah 11.5
fp50 : frekuensi persentil yaitu 50*20/10=10, nilai 10 ada di frekuensi ke 8
fkp50 : frekuensi kumulatif sebelum persentil 50 yaitu frekuensi sebelum 8 adalah 2
>P50 =tbp50+interval *(((50*length(data)/fkp50)/fp50) Artinya Variable P50 diberi nilai variable tbp50 ditambah interval dikali 50 (Karena mencari Persentil ke-50) dikali jumlah data lalu dikurangi frekuensi kumulatif persentil 50 kemudian dibagi fp50, Sehingga dihasilkan nilai P50 yaitu 385.75


MEMBUAT GRAFIK HISTOGRAM


Logika Program :
> hist (data,main=”HISTOGRAM”) Artinya Merupakan syntax untuk pembuatan histogram yaitu hist(,main=””) sehingga grafik di atas dapat diartikan diambil dari nilai –nilai dari data yang bernama data dan diberikan judul histogram berjudul HOSTOGRAM/


MEMBUAT GRAFIK PLOT


Logika Program :
> plot(table$Titik.Tengah,table$Frekuensi, main=”Data Kelas 2KA01”) Artinya Merupakan syntax untuk pembuatan plot yaitu plot(,
. Penamaan field titik tengah dengan frekuensi pada syntax pembuatan plot harus sama dengan pemberian nama pada tabel sebenarnya yang telah dibuat.

Akhirnyaaaaaaaaa.. kelar juga fauzi nulis nih postingan.. hehehehe.. tapi demi bacaan berkualitas demi dunia IT pendidikan praktikum kampus, apa sih yang nggak kalo mengenai kepentingan pengunjung setia fauzi online.. hehehehe
Doain yah teman-teman, semoga ujian praktikum saya ini bisa EXCELENT.. AMIN.. AMIN YA ALLAH.. ^__^, Bye Next Post??
Rancangan Penelitian Lengkap Adalah Postingan Fauzi Online yang Sementara Direkomendasikan untuk Dibaca. Silahkan Baca... 

PERINTAH R PROGRAMMING

Statistika, hmmm... pelajaran pengumpulan data, penyajian data, dan pengolahan data yang sangat membutukan ketelitian yang begitu detail. R Programming di sini menghadirkan fitur yang dapat membantu kita khusunya dalam pengolahan data statistika, seperti halnya pengurutan data, mencari nilai terbesar, mencari nilai terkecil, mencari jumlah kelas, mencari interval, mencari titik tengah, mencari frekuensi kelas, dan membuat tabel hingga pembuatan histogram. Hal-Hal di atas akan kita bahas pada postingan fauzi online kali ini. Jadi yuk kita belajar yuuk? hahaha Semangaaat!!
PENYAJIAN DATA (60 DATA TRANSAKSI)

LANGKAH PERTAMA
Jangan lupa Buka dulu tuh R PROGRAMMINGNYA (Yaiyalaaah masa buka baju dulu? wkwk) KEMUDIAN BUAT DATA SEBAGAI BERIKUT:

MEMBUAT DATA:
>data=c(45,22,20,34,23,48,20,18,32,40,22,35,41,33,37,21,39,53,30,15,43,23,45,27,16,
29,22,17,25,12,22,17,21,22,33,15,34,23,29,14,19,36,11,12,24,19,24,16,31,21,20,18,9,
7,27,10,19,24,30,24)

MENGETAHUI JUMLAH DATA:
>length(data)

MENGURUTKAN DATA:
>Sort(data)

MENCARI DATA TERBESAR:
>Max(data)

MENCARI DATA TERKECIL:
>Min(data)

MENCARI JUMLAH KELAS
Logika Program :
Rumus Sturges = 1+3,322 x Log 10 (Jumlah data)
Sehingga syntax yang digunakan sebagai berikut:

>jumlah_kelas=1+3.322*log10((length(data)))

MEMBULATKAN HASIL JUMLAH_KELAS
>Round(jumlah_kelas)

TAMPILAN PADA R CONSOLE:


Memasukan Data, Mencari Data Max, Data Min, Jumlah Kelas


MENCARI INTERVAL KELAS
Logika Program :
Rumus interval: Range/Jumlah Kelas
Sehingga syntax yang digunakan sebagai berikut:

>range=max(data)-min(data)
>interval=range/jumlah_kelas
round(interval)

TAMPILAN PADA R CONSOLE:

Mencari Range dan Interval Kelas


MENCARI TITIK TENGAH
Logika Program :
Rumus interval: Batas Awal Kelas+Batas Akhir Kelas/2
Sehingga syntax yang digunakan sebagai berikut:

>mean(batas_awal_kelas1:batas_akhir_kelas2)
TAMPILAN PADA R CONSOLE:

Mencari Titik Tengah


MENCARI FREKUENSI PADA KELAS
Untuk Mencari frekuensi pada R Programming , kita harus membuat function yang nantinya dapat mempercepat mencari frekuensi masing-masing kelas.
tulis function nya terlebih dahulu:

> frekuensi = function(x,y,z)
+ {a=0
+ for (i in 1 : length(x))
+ {if (x[i] >= y &&
+ x[i] <= z)
+ {a = a + 1
+ print(a)}}}


Setelah menulis functionnya maka langkah selanjutnya yaitu memamnggil function beserta pengiriman variable ke function yang telah dibuat.
>frekuensi(nama_data,batas_awal_kelas1,batas_akhir_kelas1)

TAMPILAN PADA R CONSOLE:



Pembuatan Function Frekuensi dan Pemanggilan Function Frekuensi


MEMBUAT TABEL DENGAN ISI BATAS KELAS, TITIK TENGAH, FREKUENSI
Langkah Pertama:
Ketik tabel=edit(data.frame()) kemudian enter. Maka akan muncul tampilan layar data editor sbb:



Langkah Kedua:
Untuk menuliskan judul kolom pada tabel klik 2 kali pada tulisan header var1, kemudian ubah sesuai nama judul dan pilih type character (untuk jenis karakter):



Langkah Ketiga:
Buatlah judul kolom seperti gambar di bawah ini:



Langkah Keempat:
Masukan Batas Kelas, Titik Tengah, Serta Frekuensi pada masing-masing kelas yang telah kita peroleh nilainya sebelumnya.



Lamgkah Kelima(FINAL):
Tutup Jendela Data Editor Table, selanjutnya untuk menampilkan table yang selesai kita buat pada R Console cukup dengan cara memanggil nama variable tabel kemudian enter, maka tampilan layar sebagai berikut:



Selain perintah-perintah di atas, R Programming masih mempunyai banyak fitur yang sangat berguna bagi ilmu statistika misalnya pembuatan histogram, poligon dan lain sebagainya.. Buat pengunjung setia fauzi online, kita tunggu aja yah postingan yang jauh lebih menarik lagi. Insya ALLAH.. ^__^
Bye bye

PENGENALAN R PROGRAMMING

PENGENALAN R PROGRAMMING
Emang ada ji? bahasa R, R programming gitu?? kenapa ga dinamain U,F,K,S,T,U ajah yah?? Tanya kenapa?? tanya aja noh sama yang buat bahasa pemrogramannya.. sendiri! wkwkwk Piss fauzi bercanda koq, teman jangan ngambek yah?? hehe.. Ilmu sistem informasi itu penuh perhitungan statistika, dan matematika, oleh karena itu kita harus menguasai beberapa program yang dapat membantu kita dalam memecahkan masalah tersebut. R programming adalah anak tabung dari bahasa S atau sering kita tahu dengan software SPSS, nah kalo R ini versi gratisnya.. emang hari gini , kalo dapet yang gratis-gratis damai dah terasa hidup.. hehe
Ok Ok kenalan yuk lebih lanjut dengan R Programming.
Sejarah & Pengembangan R

R adalah suatu kesatuan software yang terintegrasi dengan beberapa fasilitas untuk manipulasi, perhitungan dan penampilan grafik yang handal. R berbasis pada bahasa pemrograman S, yang dikembangkan oleh AT&T Bell Laboratories (sekarang Lucent Technologies) pada akhir tahun ’70 an. R merupakan versi gratis dari bahasa S dari software (berbayar) yang sejenis yakni S-PLUS yang banyak digunakan para peneliti dan akademisi dalam melakukan kegiatan ilmiahnya.

Pada awalnya, versi pertama R dibuat oleh Ross Ihaka and Robert Gentleman dari Universitas Auckland, namun selanjutnya R dikembangkan oleh tim yang disebut tim inti. Tim inti (core team) terdiri dari ahli statistik, ahli komputer & pemrograman, geografi, ekonomi dari institusi yang berbeda dari seluruh dunia yang mencoba membangun sebuah sistem (software) yang handal namun dengan biaya yang sangat murah. Sampai tulisan ini dibuat, R dapat secara cuma-cuma didownload dan digunakan dengan berlisensi pada GNU General Public License.

Menurut kutipan dari penghargaan Association for Computing Machinery Software bagi John Chamber 1998, menyatakan bahwa (bahasa pemrograman) S telah “merubah orang dalam memanipulasi, visualisasi dan menganalisis data untuk selamanya”. R dibuat searah dengan ide yang ada pada bahasa pemrograman S dan program statistik lainnya.

Seperti dijelaskan sebelumnya, R merupakan “kerabat” dekat dari S-PLUS dimana secara fungsi dan sintaks/tata bahasa sama-sama menggunakan bahasa S, namun tidak identik. R dapat berinteraksi dengan program statisik, manipulasi, perhitungan dan penampilan grafik lainnnya, seperti SPSS, yang cukup popular, Microsoft Excell dengan menyediakan fasilitas import dan eksport data. Selain software di atas, R dapat melakukan import file dari software lainnya seperti, Minitab, SAS, Stat, Systat dan EpInfo.

Menurut [20], R adalah bahasa fungsional, dimana terdapat inti bahasa yang 1 menggunakan bentuk standar notasi aljabar, yang memungkinkan perhitungan numerik seperti 2+3, atau 3^11. Selain itu tersedia pula fasilitas perhitungan dengan menggunakan fungsi. Dengan beberapa fitur tersebut, R menjadi alat yang tangguh bagi para statistikawan, ahli ekonomi, peneliti dalam membantu risetnya, dikarenakan R dibangun dan didukung dengan model dan teori statistik terdepan dan menggunakan standar tertinggi bagi analisis data. R hampir dapat digunakan untuk berbagai bidang, mulai dari kalkulasi biasa (seperti kalkulator), statistik, ekonometri, geografi, hingga pemrograman komputer.


Kelebihan dan Fitur-fitur R
R mempunyai karakteristik tersendiri, dimana selalu dimulai dengan prompt “pada console-nya. R mempunyai beberapa kelebihan dan fitur-fitur yang canggih dan berguna, diantaranya:
- efektif dalam pengelolaan data dan fasilitas penyimpanan. Ukuran file yang disimpan jauh lebih kecil dibanding software lainnya.
- lengkap dalam operator perhitungan array,
- lengkap dan terdiri dari koleksi tools statistik yang terintegrasi untuk analisis data, diantaranya, mulai statistik deskriptif, fungsi probabilitas, berbagai macam uji statistik, hingga time series.
- tampilan grafik yang menarik dan fleksibel ataupun costumized
- dapat dikembangkan sesuai keperluan dan kebutuhan dan sifatnya yang terbuka, setiap orang dapat menambahkan fitur-fitur tambahan dalam bentuk paket ke dalam software R

Selain kelebihan dan kelengkapan fitur-fiturnya, hal yang terpenting lainnya yakni, R bersifat multiplatform, yakni dapat diinstall dan digunakan baik pada system operasi Windows , UNIX/LINUX maupun pada Macintosh. Untuk dua system operasi disebutkan terakhir diperlukan sedikit penyesuaian.
Selain kelebihan disebutkan di atas, R didukung oleh komunitas yang secara aktif saling berinteraksi satu sama lain melalui Internet dan didukung oleh manual atau R- help yang menyatu pada software R

Buat belajar di sesi kita selanjutnya yuk teman-teman download software nya dulu nih:
R PROGRAMMING 2.11.1
Sesi prostingan berikutnya akan dijelaskan mengenai cara membuat coding menggunakan R Programming.