حياة

كيفية تحليل الملفات النصية مع بيرل

كيفية تحليل الملفات النصية مع بيرل


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

يعد تحليل الملفات النصية أحد الأسباب التي تجعل Perl أداة رائعة لاستخراج البيانات والبرمجة النصية.

كما سترى أدناه ، يمكن استخدام Perl لإعادة صياغة مجموعة نصية بشكل أساسي. إذا نظرت لأسفل إلى الجزء الأول من النص ثم الجزء الأخير في أسفل الصفحة ، يمكنك أن ترى أن الكود الموجود في المنتصف هو ما يحول المجموعة الأولى إلى الثانية.

كيفية تحليل الملفات النصية

على سبيل المثال ، دعونا نبني برنامجًا صغيرًا يفتح ملف بيانات مفصولًا بعلامات جدولة ، ويقوم بتحليل الأعمدة إلى شيء يمكننا استخدامه.

قل ، على سبيل المثال ، أن رئيسك يسلمك ملفًا يحتوي على قائمة بالأسماء ورسائل البريد الإلكتروني وأرقام الهواتف ، ويريد منك قراءة الملف والقيام بشيء ما بالمعلومات ، مثل وضعه في قاعدة بيانات أو طباعته فقط في تقرير جيد التنسيق.

يتم فصل أعمدة الملف بحرف TAB وستبدو كما يلي:

Larry [email protected] 111-1111

Curly [email protected] 222-2222

Moe [email protected] 333-3333

إليك القائمة الكاملة التي سنعمل معها:

#! / البيرة / بن / بيرل

open (FILE، 'data.txt')؛

في حين () {

اقضم بصوت عالي.

($ name ، $ email ، $ phone) = split (" t")؛

طباعة "الاسم: $ name n"؛

طباعة "البريد الإلكتروني: $ email n"؛

طباعة "الهاتف: $ phone n"؛

طباعة "--------- n"؛

}

إغلاق الملف)؛

ىخرج؛

ملحوظة: هذا يسحب بعض التعليمات البرمجية من البرنامج التعليمي حول كيفية قراءة وكتابة الملفات في بيرل.

ما تقوم به أولاً هو فتح ملف يسمى data.txt (يجب أن يتواجد في نفس الدليل مثل البرنامج النصي Perl). بعد ذلك ، يقوم بقراءة الملف إلى المتغير catchall $ _ سطراً سطراً. في هذه الحالة ، يكون $ _ هو ضمني وليس المستخدمة فعلا في التعليمات البرمجية.

بعد القراءة في السطر ، تتم إزالة أي مسافة بيضاء من نهايتها. ثم ، يتم استخدام وظيفة الانقسام لكسر السطر الموجود على حرف علامة التبويب. في هذه الحالة ، يتم تمثيل علامة التبويب بواسطة الرمز ر. على يسار علامة الانقسام ، سترى أنني أقوم بتعيين مجموعة من ثلاثة متغيرات مختلفة. هذه تمثل واحدًا لكل عمود في السطر.

أخيرًا ، تتم طباعة كل متغير تم فصله عن خط الملف بشكل منفصل حتى تتمكن من معرفة كيفية الوصول إلى بيانات كل عمود على حدة.

يجب أن يبدو إخراج البرنامج النصي كما يلي:

الاسم: لاري

البريد الإلكتروني: [email protected]

هاتف: 111-1111

---------

الاسم: مجعد

البريد الإلكتروني: [email protected]

هاتف: 222-2222

---------

الاسم: مو

البريد الإلكتروني: [email protected]

هاتف: 333-3333

---------

على الرغم من أننا في هذا المثال نقوم فقط بطباعة البيانات ، سيكون من السهل جدًا تخزين نفس المعلومات التي تم تحليلها من ملف TSV أو CSV ، في قاعدة بيانات كاملة.



تعليقات:

  1. Laidly

    أنا أعتبر، أنك لست على حق. أنا متأكد. يمكنني إثبات ذلك. اكتب لي في رئيس الوزراء ، سوف نتحدث.

  2. Baram

    أحسنت ، يبدو لي هذه هي الفكرة الرائعة

  3. Tokala

    اللعنة!

  4. Usk-Water

    لم تكن مخطئا ، كل شيء صحيح

  5. Kilkis

    نكتة القصدير !!



اكتب رسالة