Contents
Wahalo, kali ini kita akan belajar memakai Google Colab untuk manipulasi file archive. Kalian pasti tahu jenis file archive ini terkhusus untuk mempacking banyak files dalam satu file. Apa saja file Archive bisa kalian lihat jenis ekstensinya, ada .zip, .rar, .7z; Kita akan melakukan kelola file archive langsung dari drive google dengan mengakses file archive yang disimpan di google drive. Yap, Google Colab merupakan online IDE untuk melakukan aktivitas scripting dengan meminjam resource dan mesin dari google. Oke, berikut tutorial google colab: manipulasi Archive Files part 1, Cara ekstraks compressed file di Google Drive.
Pertama, kita kunjungi situs google colab terlebih dahulu. Dan inilah tampilan antarmuka dari Google Colab.

Workspace google colab dinamakan notebook dengan format ekstensi ipynb, untuk membuat workspace baru, klik new notebook pada popup atau pada menu file pilih new notebook. Perhatikan gambar di bawah ini supaya lebih paham.

Challenge 1: Basic Google Colab
Dalam “dokumen / sheet” google colab, bentuknya kosongan seperti google docs dan microsoft word. Untuk mengisi dokumen tersebut, ada dua opsi yaitu membuat balok untuk teks dan balok untuk kode. Dua opsi ini ada di paling atas dokumen.

+ Code akan membuat block seperti kotak yang bisa kamu ketik kode. Kode yang digunakan adalah python serta beberapa command yang umum dimiliki terminal linux seperti grep, cd, mkdir dll. Balok kode ini biasa disebut cell dalam google colab.
+ Text umumnya untuk komentar kode dan deskripsi karena blok ini pure untuk rich text visualization.

Tantangan pertama buat block kode (klik opsi +code) lalu isi blok dengan code di bawah.
from google.colab import drive
drive.mount('/content/drive')untuk menjalankan kode yang ada di dalam blok, geser kusor ke blok tersebut lalu klik play button yang berada tepat disamping balok:

script ini digunakan untuk koneksi google drive, namun kita perlu autentikasi terlebih dahulu. Dengan nge-run blok kode ini, nanti akan muncul popup untuk meminta izin mengakses drive.

Klik connect to google drive.
Bukti kalau script di blok ini telah selesai dan berhasil dijalankan adalah ada tanda centang hijau.

Oh iya, Ketika kamu geser kursor ke tepat bagian bawah blok akan muncul menu code dan text yang fiturnya persis seperti menu serupa yang berada di atas.

Mengakses Google Drive menggunakan Google Colab (personal, gsuite, dan shared)
Jika kamu sudah berhasil autentikasi akses ke google drive, kamu bisa lihat folder, file dan drive google di sidebar dengan klik icon folder di sidebar kiri.

semua list penyimpanan akun manapun akan muncul di dalam folder drive. Selama kamu berhasil run script untuk mount drive diatas.
Jika drive google masih belum muncul, coba setelah klik menu folder di kiri sidebar, klik kanan lalu pilih refresh.
Chalenge 2: Unzip multi part archive files langsung dengan google Colab ke lokasi direktori berbeda
Kita langsung ke tantangan yang cukup greget, suppose kamu ingin mengekstrak file compressed dengan format zip. Kamu ingin mengekstrak file archive tersebut di folder tertentu dan di drive tertentu. Yang kamu perlukan adalah menjalankan kode berikut:
Tolong jangan bingung ketika saya tulis compressed files dan archived file, artinya sama saja. Selain itu, split archive sering pula disebut multipart dan multivolume karena merupakan satu file archive yang dipecah menjadi beberapa bagian (splitted into multiple) dengan tujuan memecah ukuran files original menjadi file-file archive yang lebih kecil.
!unzip "/content/drive/location_of_zipped_file/your_named_file.part1.zip" -d "/content/drive/Shareddrives/location_you_want_to_extract_file/"
yang diisi di dalam tanda petik “” adalah lokasi file atau folder. Kamu bisa mendapatkan path dengan cara klik kanan pada folder atau file yang kamu target. Lalu copy path.

Penjelasan pada kode diatas adalah lakukan unzip your_named_file yang mana filenya dalam bentuk split archive, ditandai dengan hint .part1. library unzip akan otomatis menggabungkan split files lain: .part2., part3, dan seterusnya sebelum mengekstraks menjadi satu.
-d "/content/drive/Shareddrives/location_you_want_to_extract_file/" artinya destinasi ekstrak filenya akan diletakkan dimana? Pastikan lokasi file destinasi benar-benar ada, caranya dengan melakukan copy path.
Cukup mudah kan? Namun cara diatas hanya berlaku untuk file yang diarsip dengan format zip. Bagaimana dengan format file archive yang lain?
Cara Ekstrak File Archive Rar dengan Google Colab
jika ekstrak zip files kita menggunakan command unzip, maka untuk file rar kita menggunakan unrar. Bahkan untuk mengekstraks rar file yang dipisah menjadi beberapa part pun (part1, part2,..) caranya hampir sama.
!unrar x -Y "/content/drive/path/input_file_name.rar" "/content/drive/path/output_folder/"

di sini mungkin terlihat ada beberapa ekstra sintaks seperti x, ini artinya unrar ekstrak “file follow nakotech.part1” ke destinasi folder “ft”.
Untuk mempermudah agar kamu lebih bisa menggunakan rar dan zip command, bisa dilihat dokumentasi untuk unrar dengan menjalankan unrar dan untuk unzip --help.

Extract file .tar dengan Google Colab
untuk file yang di compress dengan ekstensi tar, perlu beberapa kombinasi (-) tergantung tipe .tar.
Gunakan salah satu dari tiga ini:
- !tar -xvf “/content/drive/path/input_file_name.tar” -C “/content/drive/path/output_folder/” #[gunakan untuk format .tar]
- !tar -xzvf “/content/drive/path/input_file_name.tar.gz” -C “/content/drive/path/output_folder/” #[jalankan kode ini di dalam cell untuk extract file tar.gz]
- !tar -xjvf “/content/drive/path/input_file_name.tar.bz2” -C “/content/drive/path/output_folder/” #[[jalankan kode ini di dalam cell untuk extract tar.bz2 files]
Menggunakan 7z untuk ekstrak compressed files
Ini library archive yang sangat versatile karena bisa melakukan extract file archive dimana split name-nya ditaruh setelah ekstensi, contoh, file_compressed.zip.part1. 7zip juga support regular expression.
langkah opsional, kamu perlu install 7zip di google colab
!apt install p7zip-fullselanjutnya, perhatikan gambar di bawah:

!7z x "/content/drive/Shareddrives/tna4/folder study/Flame.part1.rar" -r -o/content/drive/Shareddrives/tna4/safe/
maksud command di atas adalah x melakukan ekstrak dengan mempertahankan struktur hierarki subfolder, jika pakai 7z e, maka output multi part archive akan flat. Untuk o itu singkatan dari output.
Hack tips, kamu bisa pakai regex di 7z
Suppose kamu punya learncoding.zip.part1, learncoding.zip.part2, dll. Cara extract multipart archive files tersebut bisa seperti ini:

Kamu lihat *.zip akan memilih secara smart file apapun yang mempunyai struktur .zip dan .001 merupakan salah satu ciri multipart arcive. 7zip akan mencoba mencari tahu apakah arsip ini merupakan split arsip dan yang apa saja volume arsip lainnya.
Bagaimana? Cukup banyakkan caranya ekstrak file arsip melalui google colab ini?
Join our list
Subscribe to our mailing list and get interesting stuff and updates to your email inbox.



0 Comments