Trentech.id
No Result
View All Result
Login / Register
  • Terbaru
  • Berita
  • Startup
  • Bisnis
  • Learn
  • Games
  • Blockchain
  • Gadget
  • Terbaru
  • Berita
  • Startup
  • Bisnis
  • Learn
  • Games
  • Blockchain
  • Gadget
Trentech.id
No Result
View All Result

Memahami Dasar-dasar “Data Science” untuk Bisnis (Part 2)

18 November 2020
in Learn
data science
1.4k
VIEWS

Daftar Isi

  • Sedikit tentang Hadoop di dalam konsep Big Data
  • Sebelum melangkah lebih jauh
4.7/5 - (8 votes)

Sebelumnya, dalam seri pertama telah dibahas tentang komponen dasar dari sebuah rangkaian dan komponen yang mengisi Data Science. Pada bagian ini akan dibahas dasar salah satu implementasi Data Science yang paling dibutuhkan saat ini, yakni Big Data.

Istilah Big Data dewasa ini bukan hal baru lagi, khususnya dalam penerapan Data Science di korporasi. Sesuai namanya, Big Data mengindikasikan pada sebuah pemrosesan data besar yang tidak bisa ditampung melalui mekanisme basis data konvensional (misalnya RDBMS). Dalam Big Data ada istilah mendasar yang sering disingkat dengan 3Vs yang menjadi karakteristik utama, yakni Volume, Velocity dan Variety.

Baca Juga:
  • Cara Memeriksa Apakah Data Email dan Password Saya Sudah Diketahui Hacker
  • Begini Langkah Mudah Mengamankan Akun Instagram dari Serangan Hacker
  • Ini 6 Keahlian Tommy Jonathan Sinaga di Internet, Apa Saja?

Volume merujuk pada limitasi besaran data yang akan diolah. Kemampuan Big Data dapat mengolah data dengan ukuran terabyte (1012bytes) atau petabyte (1015bytes). Mengapa data bisa berukuran sebesar itu, faktor Velocity (atau kecepatan interaksi data) yang akan mengukur. Velocity adalah volume data pada skala waktu tertentu, yang didapatkan dari berbagai sumber, misal dari data transaksi, data perekaman sensor, atau data yang dihasilkan dari sebuah log mesin.

Dari yang sudah sering ditangani selama ini, Velocity dapat mencapai kisaran 30 kilobyte sampai 30 gigabyte per detik. Bahkan banyak Data Engineer membutuhkan latensi yang lebih dapat, misalnya 100 milliseconds dalam perekaman data. Tren ini diyakini akan terus berkembang, menghasilkan data yang lebih besar, seiring dengan model pemrosesan real-time yang banyak diterapkan di berbagai lini bisnis dalam sebuah perusahaan. Perangkat lunak seperti Apache Sqoop, Apache Kafka atau Apache Flume menjadi beberapa yang terpopuler untuk mengolah pergerakan data besar tersebut.

Kemudian yang ketiga ialah Variety, ini berkaitan dengan jenis data –seperti yang telah dibahas dalam materi sebelumnya, umumnya akan ditemui tiga jenis data, yakni terstruktur, semi-terstruktur dan tidak terstruktur. Saking besarnya kumpulan data dari berbagai sumber dan varian, dalam ilmu Big Data ada istilah “Data Lake”. Istilah tersebut banyak digunakan oleh praktisi Big Data untuk merujuk pada sebuah sistem penyimpanan data non-hierarkis yang menampung data multi-struktur dengan sebuah arsitektur penyimpanan tertentu. Hadoop Distributed File System (HDFS) adalah salah satu contoh arsitektur penyimpanan yang sering digunakan untuk mendukung kebutuhan tersebut.

Baca Juga:
  • 5 Laporan Bisnis yang Harus Dibuat Startup Tahap Awal agar Tetap Bertahan di Tahun 2023
  • Mengenal Revenue Stream dan Business Model untuk Startup
  • Yuk Pelajari Enam Cara Tepat Melakukan Riset Pasar untuk Bisnis

Sedikit tentang Hadoop di dalam konsep Big Data

Hadoop adalah sebuah kerangka kerja open source untuk mendukung aplikasi berbasis Big Data. Ketika orang mengatakan menggunakan Hadoop maka itu mengacu pada sebuah ekosistem perangkat lunak meliputi HDFS untuk penyimpanan data, Map Reduce untuk pemrosesan data dalam jumlah besar, Spark untuk pemrosesan data secara real-time, dan YARN (Yet Another Resource Negotiator) untuk dukungan manajemen sumber daya.

Dalam sebuah implementasi yang paling sederhana, dari sebuah sumber data MapReduce akan diterapkan untuk melakukan dua hal, yakni memetakan data dan mereduksi data. Dalam tugasnya memetakan data, MapReduce mendelegasikan data ke pada sebuah “key-value”, termasuk melakukan transformasi data atau memilah data sesuai yang dibutuhkan. Sedangkan dalam tugasnya mereduksi, MapReduce akan mengagregasi data pada sebuah dataset sehingga memenuhi standar yang ada.

Jika studi kasusnya kepada sebuah data pasif, skenario di atas akan sudah cukup, tinggal memasukkan ke HDFS untuk selanjutnya diproses. Akan tetapi tantangan masa kini dalam penerapan Big Data adalah data real-time. Sehingga MapReduce perlu sebuah pendamping, dalam hal ini Spark sebagai sebuah in-memorycomputing application. Di dalamnya pengguna dapat melakukan banyak hal, termasuk melakukan query, analisis dan eksplorasi data, termasuk menjalankan algoritma tertentu misalnya Machine Learning.

Baca Juga:
  • 7 Keterampilan Yang Harus Dimiliki Programmer Untuk 5-10 Tahun Ke Depan
  • Ini Dia Cara Membuat Template WordPress Dengan Bootstrap Mudah
  • Inilah 6 Kesalahan Umum dalam Pembuatan Desain Website

Penggunaan rangkaian alat Hadoop juga memerlukan sebuah kompetensi pemrograman. Pada dasarnya Hadoop dikembangkan dari Java, akan tetapi dari perkembangannya kini bahasa lain seperti Scala, Python dan SQL telah dielaborasikan ke dalam proses pengelolaannya. MapReduce secara native menggunakan Java, sedangkan Spark menggunakan Scala. Namun sekarang juga sudah ada dukungan PySpark sehingga dapat mengelola Spark dengan pemrograman berbasis Python. Sedangkan untuk pengelolaan di HDFS tetap menggunakan SQL.

Sebelum melangkah lebih jauh

Melakukan implementasi Big Data dalam sebuah unit bisnis memang membutuhkan waktu, bahkan beberapa perusahaan menempatkan implementasi Big Data pada long-term vision, karena prosesnya harus berelaborasi dengan kegiatan lain dalam unit bisnis. Namun sebelum melangkah lebih jauh dan mempelajari teknisnya secara lebih mendalam, perlu diketahui terlebih dulu tentang visi Data Science dari sebuah bisnis. Mungkin akan cukup beragam namun setidaknya mencakup tiga hal, yakni (1) mengidentifikasi tantangan bisnis, (2) memecahkan masalah bisnis dengan pendekatan data, dan (3) meningkatkan keuntungan di seluruh lini bisnis.

Big Data adalah bentuk penerapan Data Science dalam skala besar. Untuk mengawali awarenesstentang data sebenarnya bisa dilakukan dengan cara yang paling sederhana. Sebagai contoh akan mengangkat studi kasus bisnis media. Hal paling awal yang dapat dilakukan ialah mengidentifikasi sumber data yang ada, apakah itu dari basis data yang dihasilkan melalui Content Management System (CMS), data trafik pengunjung yang didapat melalui Anaytic Tools, atau bahkan data dari luar –misalnya identifikasi tren topik dari media sosial atau mesin pencari.

Berikutnya, tentukan masalah apa yang ingin dipecahkan. Sebagai contoh, media tersebut memiliki topik bulanan untuk sebuah opini. Maka tugas Data Science di sini bisa saja berbentuk menghubungkan tren data di media sosial tentang popularitas suatu tema dihubungkan dengan popularitas tulisan-tulisan sebelumnya berkaitan dengan tema tersebut. Jika datanya sudah lebih terstruktur, misalnya dalam format CSV, maka alat seperti R Studio akan memudahkan dalam visualisasi.

Baca Juga:
  • 5 Laporan Bisnis yang Harus Dibuat Startup Tahap Awal agar Tetap Bertahan di Tahun 2023
  • Mengenal Revenue Stream dan Business Model untuk Startup
  • Yuk Pelajari Enam Cara Tepat Melakukan Riset Pasar untuk Bisnis

Bahasa R sendiri salah satu bagian mendasar ketika seseorang ingin mempelajari tentang Data Science. Banyak cara yang dapat dilakukan untuk mempelajarinya, mulai dari menggunakan sumber online di internet, buku atau mengikuti kursus khusus yang dilaksanakan bersama trainertersertifikasi. Di Indonesia, salah satu pelatihan tentang Data Science dilakukan oleh Algoritma. Beberapa waktu lalu Algoritma mengadakan pelatihan Data Science Fundamental dan Data Science for Financial Business. Selain disajikan bahasan secara konsep, para peserta diajak langsung mencoba melakukan programming dengan bahasa R untuk pengelolaan dan visualisasi data.

Kecakapan dalam memvisualisasikan data sangat penting, karena data yang berbentuk visual akan lebih mudah dibaca. Dari sini –menyambung studi kasus di atas—maka dapat dilanjutkan dengan sebuah diskusi oleh pimpinan redaksi atau tim editorial tentang pertimbangan untuk memilih tema tersebut. Kira-kira seperti itu konsep sederhana yang dapat diterapkan dari ilmu Data Science, yang paling sederhana.

Pada seri berikutnya akan dibahas tentang bagaimana sebuah bisnis/perusahaan mengubah pola dan proses di dalamnya sehingga menjadi lebih data-driven. Akan disampaikan juga contoh penerapan yang telah berhasil dilakukan oleh startup sukses dari Indonesia. [ds/ap]

Tags: bisnisdasardatadata science
Previous Post

Memahami Dasar-dasar “Data Science” untuk Bisnis (Part 1)

Next Post

Memahami Dasar-dasar “Data Science” untuk Bisnis (Part 3)

Trentech.id

Trentech.id

Tren Teknologi Indonesia

Related Posts

rekomendasi film belajar bisnis drama korea

Rekomendasi Film Belajar Bisnis dari Drama Korea

28 October 2022
1.6k

Belajar bisnis bisa dari mana saja. Tak bisa dipungkiri bahwa drama Korea saat ini tengah menjadi tontonan yang cukup dinantikan...

menjadi data science

Empat Hal yang Perlu Dicermati Jika Ingin Menjadi “Data Scientist”

13 June 2022
1.4k

Makin besarnya permintaan tenaga data scientist di Indonesia saat ini, ternyata tidak dibarengi dengan jumlah tenaga data scientist yang berkualitas. Hal tersebut terjadi karena...

data science pada bank

Proses Data Science Pada Bank-Bank Besar Indonesia

27 May 2022
1.6k

Data Science termasuk salah satu profesi yang kini sangat dicari oleh perusahaan teknologi. Kebutuhan yang besar ini rupanya tidak sejalan...

Please login to join discussion

Terpopuler

  • contoh pitch deck

    8 Contoh Pitch Deck Startup yang Bisa Kamu Pelajari

    925 shares
    Share 370 Tweet 231
  • Kumpulan Materi Kuliah Jurusan Teknik Informatika dan Ilmu Komputer

    329 shares
    Share 132 Tweet 82
  • Masa Depan Zoom Tercoreng PHK: Dampak dan Prospek

    108 shares
    Share 43 Tweet 27
  • Menjelajahi Kelebihan dan Keterbatasan Chatbot AI BARD

    108 shares
    Share 43 Tweet 27
  • Upgrade XAMPP? Beginilah Caranya

    231 shares
    Share 92 Tweet 58
  • Masa Depan Bitcoin Kian Terancam

    108 shares
    Share 43 Tweet 27
  • Startup Kecerdasan Buatan (AI) Membawa Solusi Baru dalam Industri

    108 shares
    Share 43 Tweet 27
  • Alasan Mahasiswa IT Harus Bisa Coding

    121 shares
    Share 48 Tweet 30
  • Sistem Baru TikTok: Solusi Terbaru untuk Kreativitas dan Keamanan Pengguna

    108 shares
    Share 43 Tweet 27
  • Dampak PHK Masal eBay pada Karyawan dan Industri E-commerce

    108 shares
    Share 43 Tweet 27

About . Contact . Partnership

Trentech.id adalah situs yang menyajikan konten tentang startup, bisnis, game, event, hingga informasi pekerjaan. Trentech berusaha memberikan konten yang berkualitas untuk para pembacanya agar dapat menjadi rujukan utama mengenai dunia teknologi pada khususnya. Tim trentech terdiri dari orang – orang yang berkompeten dibidangnya, dan akan selalu mendukung karya – karya terbaik anak bangsa dengan memberikan kesempatan seluas-luasnya untuk para startup agar dapat publish karyanya di trentech.

Trentech ID

  • About
  • Contact
  • Partnership
  • Panduan Penulis
  • Privacy Policy
  • Sitemap

Tools

  • Harga Crypto Terbaru
  • Cek Ongkir
  • Cek Resi
  • Cek Domain
  • Terbaru
  • Berita
  • Startup
  • Bisnis
  • Learn
  • Games
  • Blockchain
  • Gadget
Login / Register

Welcome Back!

Login to your account below

Forgotten Password? Sign Up

Create New Account!

Fill the forms below to register

All fields are required. Log In

Retrieve your password

Please enter your username or email address to reset your password.

Log In
  • Login
  • Sign Up
Forgot Password?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.