Data analytics use SAP Analytics Data Part 4
Akhirnya kita sampai di bagian ini:
Step by step how to process so much raw data into a data that is useful information.
Login ke SAP Analytics Cloud
https://aseandse.ap11.hcs.cloud.sap/hub/index.html
Lalu login dengan akun yang terdaftar sebab layanan ini berbayar.
Berhasil masuk, maka akan tampil. Pilih aja pojok kiri atas show menu -> pilih SAP Analytics Cloud
Masuk ke aseandse
Ke menu navigation bar
Pilih From CSV or Excel File
Import dataset file CSV dari https://drive.google.com/file/d/1RRjAZ17UGpkDqhWxYHUifl-SbEvmJnKC/view?usp=sharing
Bukalah dokumen yang baru saja Kamu unduh. Jangan keluar ataupun menutup aplikasi SAC pada penelusuran web Kamu, kita akan kembali menggunakan SAC setelah ini
Bukalah lembar Excel yang berjudul UK Accident Information (Data Import).xlsx Kita dapat mengakses kumpulan data berikut dari portal database di internet. Data ini tidak 100% akurat, namun cukup mirip dengan keadaan yang sebenarnya di lapangan. Data ini telah disesuaikan sebelumnya untuk meMenuhi kebutuhan latihan ini yang nantinya digunakan di dalam SAP Analytics Cloud (SAC). Sekarang akan dijabarkan isi dari kumpulan data ini.
Pertama, terdapat kolom Accident ID atau kode identifikasi setiap kejadian, dengan kata lain penomoran untuk setiap laporan kecelakaan. Di sebelahnya terdapat kolom tanggal / Date, dan dapat dilihat pada kolom tersebut terdapat data yang berisi ‘X’ yang nantinya akan kita gunakan sebagai latihan untuk melakukan pembersihan data.
Lalu, terdapat beberapa informasi tentang letak geografis kejadian, seperti negara / country, nama kota / city descriptions, dan dilengkapi dengan koordinat garis lintang / longitude dan garis bujur / latitude yang nantinya akan kita gunakan untuk melakukan analisis geospasial.
Selain itu, terdapat informasi tambahan seputar kecelakaan yang terjadi misalnya: — Kapan terjadinya kecelakaan tersebut? — Bagaimanakah kondisi jalan saat itu? — Apakah kecelakaan terjadi di dekat rambu tkamu berhenti? Atau terjadi di dekat lampu lalu lintas? Ataupun di dekat polisi lalu lintas? — Dimanakah kecelakaan terjadi? Apakah di daerah terpencil atau di tengah perkotaan?
Di samping itu, terdapat beberapa informasi lain tentang kendaraan yang terlibat: — Apakah pengemudi berjenis kelamin lakilaki atau perempuan? — Berapakah usia pengemudinya? — Jenis kendaraan seperti apa yang dikemudikan? — Apa jenis mesin kendaraan tersebut? (misal: diesel atau non-diesel) — Apakah kendaraan yang digunakan menggunakan listrik atau bahan bakar?
Di sebelah kanannya, kita memiliki beberapa Ukuran numerik. Setiap baris data Menunjukkan satu kecelakaan, tetapi kita juga dapat melihat jumlah korban dan kendaraan yang terlibat serta kerugian akibat kecelakaan, entah karena kerusakan, atau biaya
Seperti itu detail baris yang terdapat di dataset kita.
Dalam beberapa saat, kamu akan menerima pesan bahwa data kamu telah berhasil diunggah. Kamu juga dapat melihat tabel yang berisi data seperti yang kita lihat di Excel sebelumnya.
Lakukan cleaning data, sebab mengacu pada garbage in garbage out. Maka data yang diolah harus senantiasa bersih. Ada 1 Issue yang berwarna merah, dimana kualitas data ada yang belum bersih dan harus kita cleaning. Yaitu tanda X dan Y. Kita klik seperti gambar dibawah lalu ubah value dengan 2017.Jan
Setelah kita ubah maka akan tampil seperti ini dan data quality menjadi 100% dan berubah berwarna hijau dari yang tadinya merah.
Buat hirarki negara dan kota yang ada di UK
Pilih Level-Based-Hierarchy
Masukkan nama city untuk hirarki terdiri dari region dan country
Klik ok, muncul kolom baru ikonnya hierarki. Dengan lihat pada city itu pada kanan tampilan ini. Ada Country (Negara) dan Location Description (kota).
Kita juga akan memanfaatkan data garis lintang dan bujur. Di bawah bagian “Actions”, tekanlah tombol “Geo Enrich by:” Dua pilihan akan muncul: Coordinates atau Area Name. Untuk dapat mendapatkan data yang lebih spesifik, sangat disarankan untuk menggunakan data garis lintang dan bujur, yang akan kita gunakan hari ini.
Setelah selesai, data titik geografis akan otomatis dibuat di bagian kanan kolom data. Setelah membuat titik geografis ini, kita sudah tidak memerlukan data garis lintang dan bujur lagi untuk analisis nanti. Pilihlah kolom “Longitude” dan “Latitude ” Klik kanan pada kolom yang telah dipilih dan klik “Delete Columns ” *PENTING: Jangan menghapus kolom Location ID, Kamu HANYA perlu menghapus kolom data latitude dan longitude.
Terakhir, bergeserlah ke sebelah kanan untuk memastikan kolom ‘Number of Accidents’, ‘Number of Casualties ’, dan ‘Number of Vehicles’ dideteksi sebagai Measure (bukan Generic Dimension). Lakukan ini untuk tiap -tiap kolom tadi (Numbers of xxx )
Data kita sudah bersih. Kita sudah lakukan cleaning data. Lalu beralih ke Card View layout. Apakah masih ada issues atau tidak?
Kamu bisa melihat kumpulan data tersebut sekali lagi dengan mengubah tampilannya ke bentuk kotak /grid untuk memastikan bahwa semuanya sudah berwarna hijau penuh dan siap digunakan untuk analisis.
Hasilnya warna hijau semua.
Klik “Create Model” Sebuah pop -up seharusnya muncul ketika sistem menjalankan tes validitas sekali lagi. Klik “Create ”
Tunggu beberapa saat, sebab layanan kita ini adalah cloud SaaS.
Klik Create lalu aplikasi akan memproses. Pada save model klik ok untuk menyimpan data model yang telah dibuat di exercise 1 ini.
Artinya sudah sukses membuat data model uk accident ini
Berhasil! Kamu telah membuat sebuah model! Pada latihan ini, kita telah belajar untuk:
— Mengimpor kumpulan data
— Mengevaluasi kumpulan data
— Memperbaiki beberapa data keliru
— Membuat hierarki
— Memperbaiki data titik geografis
— Mengubah tipe kolom dari Generic Dimension menjadi Measure / Ukuran
Kita akan lanjut exercise 2 di part 5