ပိဋကမြန်မာဘာသာပြန်
တလောကမိတ်ဆွေကိုသင်းက ပိဋကဘာသာပြန်ဖတ်ချင်တယ်ဆိုလို့ အင်တာနက်ထဲရှာကြည်တော့ ဒီမှာ တွေ့ပါတယ်။ သူကိုပေးဘို့ အဲဒီဝဘ်စာမျက်နှာကနေဖိုင်တဖိုင်ခြင်းဒေါင်းလုတ်ဆွဲရရင် ဝိနည်းက ၆-ဖိုင်၊ သုတ္တံက ၃၅-ဖိုင်၊ အဘိဓမ္မာက ၄-ဖိုင်ဆိုတော့ အတော်လက်ဝင်မယ်။ ဖိုင်အများကိုအစုလိုက်ဒေါင်းလုတ်ဆွဲတာကိုလုပ်ဘူးပေမဲ့မေ့နေပြီ။ ဒါပေမဲ့ခုအခါမှာ AI ကိုမေးရင်အားလုံးကအတော်လွယ်နေပြီ။ ဒီနည်းနဲ့လုပ်၊ ပြီးတော့လုပ်နည်းကိုမျှလိုက်ပါတယ်။
ထုံးစံအတိုင်းကျနော်က R-ကွန်ပျူတာဘာသာစကားကိုသုံးပါတယ်။ နည်းစဉ်က -
(၁) rvest ပရိုဂရမ်သုံးပြီး ဝဘ်စာမျက်နှာမှာရှိနေတဲ့ ဒေါင်းလုတ်လိပ်စာ (url) အားလုံးကိုထုတ်ယူ၊
(၂) ဒေါင်းလုတ်လိပ်စာအားလုံးထဲက ပိဋကဖိုင်များလိပ်စာကို regex သုံးပြီးထုတ်ယူ၊
(၃) curl ပရိုဂရမ်သုံးပြီး လိုချင်တဲ့ဖိုင်များကိုဒေါင်းလုတ်ဆွဲ။
url အားလုံးကိုထုတ်ယူပြီး ပိဋကဖိုင်လိပ်စာများကိုသာယူ
library(rvest)
url <- "https://www.dhammadownload.com/MyanmarTipitaka-eBook.htm"
webpage <- read_html(url)
link_nodes <- webpage %>% html_nodes("a")
extracted_urls <- link_nodes %>% html_attr("href")
# keep only the urls for Tipitaka files
tPitaka_2dld <- extracted_urls[which(grepl("https://dhammadownload.com/File-Library/MyanmarTipitaka/[0-9]", extracted_urls))]
tPitaka_2dld [1] "https://dhammadownload.com/File-Library/MyanmarTipitaka/01_Vinaya/01_Parajika%20Pali.doc"
[2] "https://dhammadownload.com/File-Library/MyanmarTipitaka/01_Vinaya/02a_Pacittiya%20Pali%20(Bhikkhu).doc"
[3] "https://dhammadownload.com/File-Library/MyanmarTipitaka/01_Vinaya/02b_Pacittiya%20Pali%20(Bhikkhuni).doc"
[4] "https://dhammadownload.com/File-Library/MyanmarTipitaka/01_Vinaya/03_Mahavagga%20Pali.doc"
[5] "https://dhammadownload.com/File-Library/MyanmarTipitaka/01_Vinaya/04_Culavagga%20Pali.doc"
[6] "https://dhammadownload.com/File-Library/MyanmarTipitaka/01_Vinaya/05_Parivara%20Pali.doc"
[7] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/01_Digha-nikaya/01_Silakkhandhavagga.doc"
[8] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/01_Digha-nikaya/02_Mahavagga.doc"
[9] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/01_Digha-nikaya/03_Pathikavagga.doc"
[10] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/02_Majjima-nikaya/01_Mulapannasa.doc"
[11] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/02_Majjima-nikaya/02_Majjima-pannasa.doc"
[12] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/02_Majjima-nikaya/03_Upari-pannasa.doc"
[13] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/03_Samyutta-nikaya/01_Sagatha-sam.doc"
[14] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/03_Samyutta-nikaya/02_Nidana-sam.doc"
[15] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/03_Samyutta-nikaya/03_Khandha-sam.doc"
[16] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/03_Samyutta-nikaya/04_Salayatana-sam.doc"
[17] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/03_Samyutta-nikaya/05_Mahavagga-sam.doc"
[18] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/01_An.doc"
[19] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/02_An.doc"
[20] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/03_An.doc"
[21] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/04_An.doc"
[22] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/05_An.doc"
[23] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/06_An.doc"
[24] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/07_An.doc"
[25] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/08_An.doc"
[26] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/09_An.doc"
[27] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/10_An.doc"
[28] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/04_Anguttara-nikaya/11_An.doc"
[29] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/01_Khuddakapatha.doc"
[30] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/02_Dhammapada.doc"
[31] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/03_Udana.doc"
[32] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/04_Itivuttaka.doc"
[33] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/05_Suttanipata.doc"
[34] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/06_Vimanavatthu.doc"
[35] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/07_Petavatthu.doc"
[36] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/08_Patisambhidamagga.doc"
[37] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/09_Therapadana.doc"
[38] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/10_Theripadana.doc"
[39] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/11_Buddhavamsa.doc"
[40] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/12_Cariyapitaka.doc"
[41] "https://dhammadownload.com/File-Library/MyanmarTipitaka/02_Suttanta/05_Khuddaka-nikaya/13_Milindapanha.doc"
[42] "https://dhammadownload.com/File-Library/MyanmarTipitaka/03_Abhiddhama/01_Dhammasangani.doc"
[43] "https://dhammadownload.com/File-Library/MyanmarTipitaka/03_Abhiddhama/02_Vibanga.doc"
[44] "https://dhammadownload.com/File-Library/MyanmarTipitaka/03_Abhiddhama/05_Puggalapannatti.doc"
[45] "https://dhammadownload.com/File-Library/MyanmarTipitaka/03_Abhiddhama/04_Kathavatthu.doc" နမူနာအဖြစ် ပထမနိကာယ်သုံးရပ်ကို ဒေါင်းလုတ်ဆွဲ
# select files for download
urls <- tPitaka_2dld[7:17]
# specify destination folder
dest <- "E:/00-TIPITAKA/NIKAYA_1"
library(curl)
# download
for (u in urls) {
name <- basename(u)
out <- file.path(dest, name)
h <- new_handle()
handle_setheaders(
h,
"User-Agent" = "Mozilla/5.0 (Windows NT 10.0; Win64; x64)",
"Referer" = "https://dhammadownload.com/"
)
curl_download(u, out, handle = h)
cat("Saved:", out, "\n")
}Saved: E:/00-TIPITAKA/NIKAYA_1/01_Silakkhandhavagga.doc
Saved: E:/00-TIPITAKA/NIKAYA_1/02_Mahavagga.doc
Saved: E:/00-TIPITAKA/NIKAYA_1/03_Pathikavagga.doc
Saved: E:/00-TIPITAKA/NIKAYA_1/01_Mulapannasa.doc
Saved: E:/00-TIPITAKA/NIKAYA_1/02_Majjima-pannasa.doc
Saved: E:/00-TIPITAKA/NIKAYA_1/03_Upari-pannasa.doc
Saved: E:/00-TIPITAKA/NIKAYA_1/01_Sagatha-sam.doc
Saved: E:/00-TIPITAKA/NIKAYA_1/02_Nidana-sam.doc
Saved: E:/00-TIPITAKA/NIKAYA_1/03_Khandha-sam.doc
Saved: E:/00-TIPITAKA/NIKAYA_1/04_Salayatana-sam.doc
Saved: E:/00-TIPITAKA/NIKAYA_1/05_Mahavagga-sam.doc မှတ်ချက်။ ။ဒေါင်းလုတ်ဆွဲ ပရိုဂရမ်ကိုရဘို့ chatGPT AI ရဲ့အကြံပေးချက်ကိုစမ်းလိုက်ပြင်လိုက်အကြိမ်ခပ်များများလုပ်ပြီးမှအောင်မြင်ပါတယ်။ သူ့ဘက်ကဖြီးတာလဲပါပါတယ်။ ဥပမာ ကျနော်သုံးနေတဲ့ R-ပရိုဂရမ်တခုမှာသူပြောတဲ့ ပရိုဂရမ်ခွဲလေးတခုမပါဘူး အဲဒါကျနော့ပင်မပရိုဂရမ်က သိပ်ဟောင်းနေတာကြောင့်လို့ပြောတယ်။ တကယ်က အဲဒီပင်မပရိုဂရမ်က လက်ရှိ latest version ပါ။ သူပြောတဲ့ပရိုဂရမ်ခွဲ လဲမရှိပါဘူး။
ပြောရဦးမယ်။ ဂ၀-စွန်းအဖိုးကြီးဆိုတော့ ဒီလိုမတောက်တခေါက်လုပ်နိုင်တာလေးကိုဇာချဲ့နေတာကိုနားလည်ပေးကြပါ။
ဘာဆက်လုပ်ရင်ကောင်းမလဲ
ဒေါင်းလုတ်ဆွဲပြီးရတဲ့ပိဋကဖိုင်တွေကို Win Innwa စာလုံးတွေနဲ့ရေးထားတယ်။ ဆက်သုံးဘို့ ယူနီကုတ်ပြောင်းရင်ကောင်းမှာဘဲ။
No comments:
Post a Comment