Cara Mengekstrak Tautan dari Halaman Web di Windows

Anda mungkin perlu mengekstrak tautan (URL) di laman web untuk tujuan berbeda - mis., Riset internet, pengembangan web, penilaian keamanan, atau pengujian laman web. Artikel ini memberi tahu Anda cara mengekstrak tautan dari halaman web atau dokumen HTML di Windows.

Cara Mengekstrak Tautan dari Halaman Web di Windows

Ada beberapa metode untuk mengekstrak URL di halaman web. Mari kita mulai dengan cara asli - menggunakan bagian alat pengembang browser web Anda.

Menggunakan Alat Pengembang browser Web Anda

  1. Buka Chrome untuk Firefox, dan kunjungi situs web atau halaman web terlebih dahulu.
  2. Tekan F12 untuk membuka jendela Alat Pengembang.
  3. Klik pada tab Konsol di Alat Pengembang.
  4. Bersihkan output konsol dengan mengeklik tombol Bersihkan konsol (di Chrome) atau Kosongkan output konsol Web (di Firefox).
  5. Ketikkan kode berikut di prompt konsol:
     Array.prototype.slice.call (document.querySelectorAll ('a'), 0) .forEach ((a, i) => console.log (`# $ {i + 1} - $ {a.innerText} - $ {a.href} `)); 

Ini menampilkan daftar tautan yang diurutkan dalam halaman web tersebut bersama dengan judul di jendela konsol.

Jika Anda hanya ingin mengambil URL tanpa nomor seri atau teks judul, gunakan perintah ini:

 url = $$ ('a'); untuk (url dalam url) console.log (url [url] .href); 

Salin output ke Notepad dan simpan.


Menggunakan PowerShell

Luncurkan PowerShell dan gunakan sintaks baris perintah berikut:

 (Invoke-WebRequest -Uri "//www.winhelponline.com/blog").Links.Href | Sortir-Objek | Dapatkan-Unik | out-gridview 

Ini mendapatkan daftar tautan di halaman web yang ditentukan dan menampilkan daftar ke kontrol tampilan grid.

Keuntungan lain dari perintah PowerShell ini adalah bahwa ia mengurutkan entri dan juga menghapus URL duplikat dari koleksi.

Kontrol tampilan grid memungkinkan Anda memfilter pencarian kata kunci kunci URL, serta menyalin daftar ke clipboard menggunakan Ctrl + C

$config[ads_text6] not found

Ambil judul dan URL

Untuk melihat innerText selain tautan atau URL yang sesuai, jalankan:

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Links | sort-object href -Unique | Format-daftar innerText, href 

Anda akan mendapatkan output seperti ini:

URL duplikat dihapus secara otomatis di output.

Anda bahkan dapat menyalin output ke clipboard secara otomatis menggunakan | clip parameter | clip :

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Links | sort-object href -Unique | Format-Daftar innerText, href | klip 

Hanya ambil URL Gambar

Untuk mengekstrak daftar URL gambar, gunakan sintaks ini:

 (Invoke-WebRequest -Uri "//www.winhelponline.com").Images | Pilih-Objek src 


Menggunakan AddrView dari Nirsoft

Alat AddrView Nirsoft mengekstraksi tautan (termasuk tautan gambar) dari halaman web yang diberikan atau file HTML lokal secara otomatis dan mencantumkannya dalam tampilan grid.

Anda bahkan dapat mengurutkan hasil berdasarkan Jenis dan hanya menyalin URL gambar ke clipboard atau menyimpan ke file.

Jika Anda hanya ingin mengambil tautan gambar, Anda dapat menggunakan opsi View Page Info bawaan Firefox. Di Firefox, klik kanan pada halaman web saat ini, klik Lihat Info Halaman → Media. Tab Media mencantumkan semua URL gambar, termasuk data:image tautan data:image . Anda dapat menyalin item yang dipilih atau semua item ke clipboard, atau menyimpan entri ke file.

Selain metode di atas, untuk browser seperti Chrome atau Firefox, ada banyak ekstensi atau add-on yang akan mengambil URL atau tautan gambar dari halaman web yang saat ini aktif di browser Anda.

Artikel Terkait