python - Limiting the searching of a large file -


तो यहां कुछ नया संशोधनों के साथ मेरा कार्यक्रम है:

  datafile = open ('C : \\ text2.txt ',' r ') fullataset = open (' C: \\ bigfile.txt ',' r ') smalldataset = open (' C: \\ smalldataset.txt ',' w ') मिलान किए गए पंक्तियाँ = डेटाफाइल में पंक्ति के लिए: splitline = line.split () को आंशिक रूप में आइटम के लिए: यदि मद नहीं है, तो। ("नोवा"): यदि item.startswith ("JJJ") या item.startswith ("KOS"): मिलान किए गए लाइन । पूरा आइटम में पंक्ति के लिए एपेंड (आइटम) काउंटर = 1: प्रिंट काउंटर काउंटर + = 1 मिलान के लिए टी में: यदि टी पंक्ति में: smalldataset.write (line) datafile.close () fullataset.close () smalldataset.close ()  

मुझे अब जो समस्या है वो है कि मैं "बड़ाफ़ाइल" के माध्यम से खोजना चाहता हूं लेकिन तेज दर पर। मैं बड़ी लाइन में लाइन की खोज को स्ट्रिंग में सीमित करना चाहूंगा, जो पहले ','

से पहले होती है, मैं कुछ जैसे इंडेक्स = aString.find (',') का उपयोग करना चाहता हूं, लेकिन I बड़ी किस्मत नहीं है बड़ी फ़ाइल की स्ट्रिंग में खोज को सीमित करता है जो पहले अल्पविराम से पहले होता है

आप बदल सकते हैं

  यदि लाइन में टी:  

से

  यदि पंक्ति में [: ​​line.find (',')]:  

यह कर सकता है प्रोग्राम तेजी से अगर लाइन बहुत लंबा है और शुरुआत के निकट अल्पविराम दिखाई देता है या यह प्रोग्राम धीमा कर सकता है यदि , को लाइन के अंत में दिखाई देता है।

PS। क्या हर लाइन इसमें अल्पविराम रखने की गारंटी है? यदि कोई अल्पविराम नहीं है तो उपरोक्त कोड थोड़ा कायरता दिखाता है उदाहरण के लिए,

  में [21]: पंक्ति = 'पाठ की एक पंक्ति' में [22]: पंक्ति [: line.find (',')] बाहर [22]: 'a यदि आप अल्पविराम के बिना लाइनों को अनदेखा करना चाहते हैं, तो यह बेहतर हो सकता है:  
  में [23]: रेखा [: रेखा। ढूंढें (',') + 1] आउट [23]: ''  

Comments

Popular posts from this blog

Eclipse CDT variable colors in editor -

AJAX doesn't send POST query -

wpf - Custom Message Box Advice -