un.js 2.3 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273
  1. var jsdom = require("jsdom");
  2. const { JSDOM } = jsdom;
  3. var fs = require("fs");
  4. var argv = require("optimist").argv;
  5. console.log("essai");
  6. var fichier = argv._[0];
  7. var html = fs.readFileSync(fichier,"UTF-8");
  8. dom = new JSDOM(html);
  9. var $ = require('jquery')(dom.window);
  10. // console.log(dom.window.$(".row .chinese").html());
  11. // console.log(dom.window.$(".row .indented ").html());
  12. // console.log("1 ****************");
  13. // console.log(dom.window.$(".row .indented img").attr("title"));
  14. // console.log("2 ****************");
  15. // var $i = dom.window.$(".row .indented");
  16. // console.log($i.html());
  17. // console.log("3 ****************");
  18. // var $k = dom.window.$(".row .indented img ").attr("title");
  19. // console.log($k);
  20. // console.log("4 ****************");
  21. // var $z = dom.window.$(".row" ).each(function(index){
  22. // console.log(index + " " + $( this ).text());
  23. // });
  24. // console.log("5 ****************");
  25. // var $z = dom.window.$(".row .chinese").each(function(index, element){
  26. // console.log(index + " " + $( element ).text());
  27. // });
  28. // console.log("6 ****************");
  29. // $z = dom.window.$(".row ").each(function(index, element){
  30. // console.log(index + " " + $(element).find(".chinese").text());
  31. // console.log(index + " " + $(element).find(".speech_samples").text());
  32. // });
  33. var maligneCVS = {
  34. "Hanzi": "",
  35. "Reading": "",
  36. "Meaning": ""
  37. };
  38. console.log("7 ****************");
  39. $z = dom.window.$(".row ").each(function(index, element){
  40. // on retrouve le texte en chinois
  41. console.log("index: " + index + " texte en hanzi: " + $(element).find("p .chinese").text());
  42. // on retrouve le texte en anglais et pinyin
  43. console.log("texte en pinyin et traduction en anglais");
  44. $(element).find(".indented img").each(function(index, letexte){
  45. console.log("---->" + $(this).attr("title"));
  46. });
  47. // on retrouve les enregistrements
  48. var $t = $(element).find(".speech_samples:first");
  49. // prononctation en chinois
  50. console.log("--> Prononciation en chinois");
  51. $t.find("tr:first td a:nth-child(2)").each(function(index, audio){
  52. console.log("--> " + index + " " + $(this).text() + " " + $(this).attr("href") );
  53. });
  54. // prononciation en anglais
  55. console.log("--> Prononciation en anglais");
  56. $t.find("tr:nth-child(2) td a:nth-child(2)").each(function(index, audio){
  57. console.log("--> " + index + " " + $(this).text() + " " + $(this).attr("href") );
  58. });
  59. });