نرم افزار مترجم

saalek110

Well-Known Member
چون فایل بزرگ است با روش simple نمیشه با فایل کار کرد. فایل 400 مگا است.
در آخرین تلاش روش ساده توانست 150 هزار لغت را داخل دیتابیس بریزد.

کل لغات 463244 لغت است. یعنی بالای 450 هزار لغت.
 

saalek110

Well-Known Member
خرد کردن فایل به شکل دستی نمی دانم ممکن باشد یا نه.

چون برای select کردن با ماوس باید خیلی بروی پایین . فایل 13 میلیون خط است اگر بخواهی یک دهمش را جدا کنی یک میلیون خط را باید رد کنی.

ولی با کد میشه فایل را خرد کرد. البته نمی دانم مشکلات بعدی پیش بیاید یا نه. منظورم مغشوش شدن اطلاعات است.

در صفحه اول تاپیک من بدون قابلیت خواندن xml توسط php کل کار را انجام دادم. با استفاده از توابع رشته ای php.ولی بعدا گفتم با خود توابع مخصوص xml بهتره این کار را بکنم ولی روش simple با این فایل بزرگ کرش می کند.
 
آخرین ویرایش:

saalek110

Well-Known Member
برای خرد کرن فایل هم مشکلاتی هست. فایل تا 40 مگا میشه داخلش نوشت. بعدش دیگه کار مختل میشه.

یعنی هر فایل باید 20 هزار لغت داشته باشه. پس 20 فایل باید بسازیم.
 

saalek110

Well-Known Member
روش های سرعت دادن به کار:

شاید بهتر باشه به جای php از سی پلاس برای دستکاری فایلها استفاده کرد

یا از اول فایل را داخل دیتابیس ریخت . منظورم خطوط فایل است.
 

saalek110

Well-Known Member
من تابحال 60 هزار لغت آپلود کردم.


صفحه نمونه دو لغت دارد که در دیتابیس وجود دارد.

مترجم ابتدا سایت اصلی را چاپ کرده
سپس سایت را کلمه-کلمه کرده و معنی هر کلمه را زیر آن نوشته
و در آخر هم مجدد سایت را چاپ کرده ولی این بار جلوی هر کلمه معنی آن نوشته شده.

-------------------------------
بعدا فایل sample ادیت شد و یک کلمه دیگر آلمانی بهش اضافه شد.
 
آخرین ویرایش:

saalek110

Well-Known Member
حروف آلمانی در دیتابیس تغییر شکل داده. احتمالا باید ستون کلمات آلمانی درست انتخاب شود.

-------------
ادیت: بعدا معلوم شد در دیتابیس حروف آلمانی تغییر شکلی طبیعی دارند. مثل کاراکترهای فارسی که در دیتابیس شکلهایی ناخوانا هستند.
 
آخرین ویرایش:

saalek110

Well-Known Member
حروف آلمانی در دیتابیس تغییر شکل داده. احتمالا باید ستون کلمات آلمانی درست انتخاب شود.

What is the best MySQL collation for German language

I am building a web site in German language, So I will be using characters like ä, ü, ß etc., So what are your recommendations?


ترجمه: میگه من دارم سایت آلمانی می سازم و کاراکترهای آلمانی ä, ü, ß دارم. پیشنهاد چیه؟

یک نفر که 30 تا لایک گرفته جواب داده که چندین انتخاب هست که رفتارهاشون فرق داره. منظور از رفتارها مثلا در مقایسه کاراکترها و از این جور عملیات. بعد گفته خلاصه utf8_unicode_ci را انتخاب کن. که case insensitive searches دارد.

بعد گفته utf8_bin هم هست که مشکل u = ü problem را ندارد ولی case sensitive search است.

سالک: با توجه به دو وصف از اینها من اولی یعنی utf8_unicode_ci را انتخاب می کنم
 
آخرین ویرایش:

saalek110

Well-Known Member
ولی باز در دیتابیس حروف تغییر شکل داده است:

r1.jpg
 
آخرین ویرایش:

saalek110

Well-Known Member
البته حروف فارسی هم در دیتابیس با کاراکترهای ناخوانا نمایش داده می شود ولی بعد چاپ درست هستند. باید این تکه از دیتابیس را چاپ کنم ببینم چاپش چطوره.

PHP:
          $sql = "SELECT * FROM german WHERE number=148 ";
       $result = mysqli_query($conn ,$sql);
    while($info = mysqli_fetch_array( $result ))
    {
    $s=$info['word'] ;
    echo $s;
    }
f3.jpg
اجرا:
Rückbau

پس موقع چاپ درست است.

پس ü در دیتابیس میشه ü(وارونه شد شما درست بخوانید)


برای اطمینان بیشتر همین کلمه Rückbau را به سایت نمونه اضافه کردم و سایت مترجم درست کلمه سایت نمونه را معنی کرد. معنی انگلیس اون در دیتابیس retrenchment است.
پس فقط در دیتابیس کلمات این شکلی است و مهم نیست.
 
آخرین ویرایش:

saalek110

Well-Known Member
من همین الان استخراج فایلهای 20 هزار لغتی از فایل 460 هزار لغتی را تمام کردم. 24 فایل شد.

با روش simple میشه این فایل ها را وارد دیتابیس کرد ولی اون فایل بزرگ مشکلات داشت.

حالا که کل لغات را دارم می تونم به قسمت یوزر و پوسته برنامه برسم. یعنی جایی که از دیتابیس استفاده میشه برای ترجمه کلمات.
 

saalek110

Well-Known Member
table به هاست منتقل شد.


463240... Anschweißmuttern ....welding on nuts
463241... Schweißervorhang ....welding screens
463242... Schweißervorhänge ....welding screens
463243... Schweißtechnikzubehör ....welding technology accessory
463244... Schweißplatzausrüstung ....welding workshop equipment
 
آخرین ویرایش:

saalek110

Well-Known Member
تشکر از حمایت دوستان که تا اینجای برنامه تکمیل شد.لذت بردم از این پروژه.
 

saalek110

Well-Known Member
فایل ۴۰۰ مگایی را که هاست مجانی من قبول نکرد
تیبل هم فقط تک معنی بود ، شاید اگر چند معنی بود و مترادف ها و ارجاع ها را اضافه می کردم نمیشد با کوئری در هاست درج کرد.


باید آن فایلهای حاصل از خرد کردن فایل ۴۰۰ مگایی که ۲۴ فایل زیر ۲۰ مگا است را آپلود کنم به هاست،
تا در خود هاست محتوا ازش استخراج کنم و تیبل بسازم.
با نرم افزارهای ftp فکر کنم راحت انجام بشه.

این پروژه باعث شد با یکی از قابلیتهای php که کار با xml است آشنا شویم.
 

saalek110

Well-Known Member
البته من فقط مشکل خودم را یک جوری حل کردم و راه درست شاید این نباشه.
شاید با قابلیت های دیگر php در کار با xml کار راحت تر و اساسی تر باشه. من با اون روش ها زیاد کار نکردم.
شاید هم راه حل درست کار دیگری باشد.

می توانید کار با فایلهای بزرگ xml را سرچ کنید ، شاید راه حل هایی پیدا کنید.

من اگر یک روز بخواهم برای زبانهای زیادی این کار را بکنم تلاش می کنم راه های بهتری پیدا کنم. ولی فعلا کارم راه افتاد.
 

جدیدترین ارسال ها

بالا