Kezdőlap › Fórumok › Vegyes gondok › Grep használata extrém helyzetben
- This topic has 38 hozzászólás, 8 résztvevő, and was last updated 16 years, 1 months telt el by
uzsolt.
-
SzerzőBejegyzés
-
2009-05-29-09:02 #2188060
Én így oldottam meg:
1. Notepad++ segítségével a CTRL+H opcióval kicseréltem a -kat [LF]-re, ami az új sort jelenti.
2. ezek után már csak annyi kellett, hogy: cat file | grep -o href.+http.+class
3. majd: cat file | sed s/href.+http/http/g #href-et és társait eltüntetem kicserélem sima http-re
4. majd: cat file | sed s/class//g #classokat eltüntetem a linkek végéről (mivel csak azok maradtak)Pesze ezt lehet egy sorban egy parancsban is csinálni, de akkor 2 hét múlva már nem emlékszel rá, hogy mit miért csináltál 🙂
2009-05-29-09:02 #2188061Én így oldottam meg:
1. Notepad++ segítségével a CTRL+H opcióval kicseréltem a -kat [LF]-re, ami az új sort jelenti.
2. ezek után már csak annyi kellett, hogy: cat file | grep -o href.+http.+class
3. majd: cat file | sed s/href.+http/http/g #href-et és társait eltüntetem kicserélem sima http-re
4. majd: cat file | sed s/class//g #classokat eltüntetem a linkek végéről (mivel csak azok maradtak)Pesze ezt lehet egy sorban egy parancsban is csinálni, de akkor 2 hét múlva már nem emlékszel rá, hogy mit miért csináltál 🙂
2009-05-29-09:47 #2188062gabriel08 wrote:Pesze ezt lehet egy sorban egy parancsban is csinálni, de akkor 2 hét múlva már nem emlékszel rá, hogy mit miért csináltál 🙂akkor el kell olvasni azt az egy sort… 😉
2009-05-29-09:47 #2188063gabriel08 wrote:Pesze ezt lehet egy sorban egy parancsban is csinálni, de akkor 2 hét múlva már nem emlékszel rá, hogy mit miért csináltál 🙂akkor el kell olvasni azt az egy sort… 😉
2009-05-29-10:26 #2188064Nem igazán látom, hogy milyen a fájlszerkezet, de szerintem így könnyebben el lehetett volna intézni (próbáld ki, kíváncsi vagyok):
Code:grep -o „href[^ url-lista2009-05-29-10:26 #2188065Nem igazán látom, hogy milyen a fájlszerkezet, de szerintem így könnyebben el lehetett volna intézni (próbáld ki, kíváncsi vagyok):
Code:grep -o „href[^ url-lista2009-05-29-10:29 #2188066dotmind wrote:A tr valoban teljesen felesleges!
grep -o „^href.*” $FILE | sed ‘s/href=|”//g’Még most se jó, így az összes linked egy sorban lesz. Ill. egy üres fájlt fogsz kapni, mert nem biztos (sőt), hogy az egyetlen sorod href-fel kezdődik.
2009-05-29-10:29 #2188067dotmind wrote:A tr valoban teljesen felesleges!
grep -o „^href.*” $FILE | sed ‘s/href=|”//g’Még most se jó, így az összes linked egy sorban lesz. Ill. egy üres fájlt fogsz kapni, mert nem biztos (sőt), hogy az egyetlen sorod href-fel kezdődik.
2009-12-04-20:03 #1889034Sziasztok!
Elég jó vagyok a „grep” segédprogram és a regexp-ek használatában, de a napokban a következő dologba buktam bele.
Gondoljatok el egy html oldalt, melyből ki szeretnétek szűrni az összes „http” linket. Ez ugye látható, hogy egyszerű feladat.De mi van akkor, ha a szóban forgó html oldal egyetlen sorból áll. A napokban ezzel találkoztam. Letöltöttem egy google keresési eredményt html oldalként, és ki akartam belőle szűrni az összes linket. Sajnos ez azonben nem sikerült, mivel az elmentett html oldal egyetlen sorból áll.
Mi a teendő?
Példa:
keressetek rá pl a „Lila Dalmata” szókombinációkra a google-ban Firefox-ot használva és CTRL+U val mentsétek el a kapott oldalt egy html fájlban. Ebből kellene kiszűrni az összes linket.PLs Help, nagyon fontos lenne. Sok-sok adatot kell feldolgoznom… 😀
-
SzerzőBejegyzés
- Be kell jelentkezni a hozzászóláshoz.
legutóbbi hsz