مرورگرها به منظور نقل و انتقال دادهها در شبکه ی جهانی وب مورد استفاده قرار میگیرند؛ کاربران سیستم عامل گنو/لینوکس علاوه بر مرورگرهای گرافیکی همچون فایرفاکس، گوگل کروم، کرومیوم، اپرا و غیره، میتوانند از مرورگرهای تحت کامند لاین نیز استفاده کنند که از جمله ی رایج ترین آنها میتوان به مرورگر کامند لاینی lynx استفاده کنند.
آشنایی با ابزار wget
گاهی اوقات در حین کار با شبکه پیش میآید که نیاز به دانلود یکسری فایل/دایرکتوری داریم اما قصد نداریم تا این کار را از طریق مرورگرهای رایجی همچون فایرفاکس یا گوگل کروم انجام دهیم. در چنین مواقعی میتوان از ابزاری تحت عنوان wget استفاده نماییم که ابزاری کامند لاینی است که با استفاده از آن میتوان فایلهای حجیم، دانلودهای Recursive، دانلودهایی که نیاز به پسورد دارند و چندین فایل به صورت همزمان دانلود کرد.
به خاطر داشته باشید |
منظور از دانلود Recursive زمانی است که برای دانلود چیزی به یک صفحه از وب رجوع میکنیم، آن صفحه ما را به صفحه ی دیگری ارجاع میدهد و … |
به منظور دانلود یک صفحه ی وب، میتوان به صورت زیر عمل کرد:
wget sokanacademy.com
به عنوان خروجی کامند فوق داریم:
--2016-09-01 20:20:53-- http://sokanacademy.com/
Resolving sokanacademy.com (sokanacademy.com)... 130.185.72.121
Connecting to sokanacademy.com (sokanacademy.com)|130.185.72.121|:80... connected.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: https://sokanacademy.com/ [following]
--2016-09-01 20:20:53-- https://sokanacademy.com/
Connecting to sokanacademy.com (sokanacademy.com)|130.185.72.121|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://www.sokanacademy.com/ [following]
--2016-09-01 20:20:53-- https://www.sokanacademy.com/
Resolving www.sokanacademy.com (www.sokanacademy.com)... 130.185.72.121
Connecting to www.sokanacademy.com (www.sokanacademy.com)|130.185.72.121|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘index.html’
index.html [ <=> ] 47.49K --.-KB/s in 0.1s
2016-09-01 20:20:54 (392 KB/s) - ‘index.html’ saved [48630]
root@sokanacademy-inspiron-1545:/home/sokanacademy/Desktop/tmp# cd ..
root@sokanacademy-inspiron-1545:/home/sokanacademy/Desktop# wget sokanacademy.com
--2016-09-02 06:30:58-- http://sokanacademy.com/
Resolving sokanacademy.com (sokanacademy.com)... 130.185.72.121
Connecting to sokanacademy.com (sokanacademy.com)|130.185.72.121|:80... connected.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: https://sokanacademy.com/ [following]
--2016-09-02 06:30:58-- https://sokanacademy.com/
Connecting to sokanacademy.com (sokanacademy.com)|130.185.72.121|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://www.sokanacademy.com/ [following]
--2016-09-02 06:30:59-- https://www.sokanacademy.com/
Resolving www.sokanacademy.com (www.sokanacademy.com)... 130.185.72.121
Connecting to www.sokanacademy.com (www.sokanacademy.com)|130.185.72.121|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘index.html’
index.html [ <=> ] 47.49K 81.7KB/s in 0.6s
2016-09-02 06:31:00 (81.7 KB/s) - ‘index.html’ saved [48630]
اگر به مسیری که کامند فوق را در آن اجرا کردهایم رجوع نماییم، میبینیم که این فایل مرتبط با صفحه ی سایت مد نظر دانلود شده است.
آشنایی با ابزار curl
گاهی اوقات برای ما پیش میآید که علاوه بر دانلود نیاز داریم تا یکسری اطلاعات اضافی -همچون سورس کدی که استفاده شده است- درباره ی یک یو آر ال به دست آوریم که در چنین شرایطی میتوان از ابزاری تحت عنوان curl استفاده نمود. یکی دیگر از قابلیتهای ابزار curl این است که همچون wget میتوان با استفاده از این ابزار محتوای یک صفحه ی وب را ذخیره کرد.
برای خواندن محتوای یک URL می بایست در کامند لاین دستور curl را وارد نموده سپس URL مد نظر را به عنوان پارامتر ورودی آن در نظر گرفت. به طور مثال، برای خواندن محتوای https://www.sokanacademy.com می بایست کامند زیر را در ترمینال اجرا کنیم:
curl https://www.sokanacademy.com
به عنوان خروجی کامند فوق، سورس کد هوم پیج سکان آکادمی را مطاحظه خواهیم نمود. پیش از این گفتیم که یکی از قابلیتهای ابزار curl ذخیره سازی صفحات وب است؛ برای این منظور، میتوان به روش زیر عمل کرد:
curl -o index.html https://www.sokanacademy.com
در دستور فوق، محتوای هوم پیج سکان آکادمی در فایلی تحت عنوان index.html ذخیره خواهد شد.