ディレクトリのすべてのファイルを一覧表示するにはどうすればよいですか?

2010年07月09日に質問されました。  ·  閲覧回数 4.9M回  ·  ソース

duhhunjonn picture
2010年07月09日

Pythonでディレクトリのすべてのファイルを一覧表示し、それらをlist追加するにはどうすればよいですか?

回答

pycruft picture
2010年07月09日
4635

os.listdir()は、ディレクトリにあるすべてのもの(ファイルディレクトリ)を取得します。

ファイルだけが必要な場合は、 os.pathを使用してこれをフィルタリングできます。

from os import listdir
from os.path import isfile, join
onlyfiles = [f for f in listdir(mypath) if isfile(join(mypath, f))]

または、 os.walk()使用すると、2つのリストファイルdirに分割されます。 トップディレクトリのみが必要な場合は、最初に生成されたときに中断できます

from os import walk

f = []
for (dirpath, dirnames, filenames) in walk(mypath):
    f.extend(filenames)
    break
adamk picture
2010年07月10日
1822

パターンマッチングと拡張を行うので、 globモジュールを使用することを好みます。

import glob
print(glob.glob("/home/adam/*.txt"))

クエリされたファイルのリストが返されます。

['/home/adam/file1.txt', '/home/adam/file2.txt', .... ]
Giovanni G. PY picture
2017年01月03日
1018

Python2および3でファイルのリストを取得する

os.listdir() -現在のディレクトリのリスト

osモジュールのlistdirを使用すると、現在のディレクトリのファイルとフォルダーを取得できます

 import os
 arr = os.listdir()
 print(arr)
 
 >>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']

Python 2

''が必要です

 arr = os.listdir('')

ディレクトリを探す

arr = os.listdir('c:\\files')

グロブからglob

globを使用すると、次のようにリストするファイルのタイプを指定できます。

import glob

txtfiles = []
for file in glob.glob("*.txt"):
    txtfiles.append(file)

globリスト内包表記

mylist = [f for f in glob.glob("*.txt")]

os.path.abspathフルパス名を取得する

見返りにフルパスを取得します

 import os
 files_path = [os.path.abspath(x) for x in os.listdir()]
 print(files_path)
 
 >>> ['F:\\documenti\applications.txt', 'F:\\documenti\collections.txt']

ウォーク:サブディレクトリを通過する

os.walkは、ルート、ディレクトリリスト、ファイルリストを返します。そのため、forループのr、d、fでそれらを解凍しました。 次に、ルートのサブフォルダー内の他のファイルとディレクトリを検索し、サブフォルダーがなくなるまで続けます。

import os

# Getting the current work directory (cwd)
thisdir = os.getcwd()

# r=root, d=directories, f = files
for r, d, f in os.walk(thisdir):
    for file in f:
        if file.endswith(".docx"):
            print(os.path.join(r, file))

os.listdir() :現在のディレクトリにあるファイルを取得します(Python 2)

Python 2では、現在のディレクトリ内のファイルのリストが必要な場合は、引数を「。」として指定する必要があります。 またはos.listdirメソッドのos.getcwd()。

 import os
 arr = os.listdir('.')
 print(arr)
 
 >>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']

ディレクトリツリーを上るには

# Method 1
x = os.listdir('..')

# Method 2
x= os.listdir('/')

ファイルの取得:特定のディレクトリ内のos.listdir() (Python 2および3)

 import os
 arr = os.listdir('F:\\python')
 print(arr)
 
 >>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']

os.listdir()特定のサブディレクトリのファイルを取得します

import os

x = os.listdir("./content")

os.walk('.') -現在のディレクトリ

 import os
 arr = next(os.walk('.'))[2]
 print(arr)
 
 >>> ['5bs_Turismo1.pdf', '5bs_Turismo1.pptx', 'esperienza.txt']

next(os.walk('.'))およびos.path.join('dir', 'file')

 import os
 arr = []
 for d,r,f in next(os.walk("F:\\_python")):
     for file in f:
         arr.append(os.path.join(r,file))

 for f in arr:
     print(files)

>>> F:\\_python\\dict_class.py
>>> F:\\_python\\programmi.txt

next(os.walk('F:\\') -フルパスを取得-リスト内包

 [os.path.join(r,file) for r,d,f in next(os.walk("F:\\_python")) for file in f]
 
 >>> ['F:\\_python\\dict_class.py', 'F:\\_python\\programmi.txt']

os.walk -フルパスを取得-サブディレクトリ内のすべてのファイル**

x = [os.path.join(r,file) for r,d,f in os.walk("F:\\_python") for file in f]
print(x)

>>> ['F:\\_python\\dict.py', 'F:\\_python\\progr.txt', 'F:\\_python\\readl.py']

os.listdir() -txtファイルのみを取得します

 arr_txt = [x for x in os.listdir() if x.endswith(".txt")]
 print(arr_txt)
 
 >>> ['work.txt', '3ebooks.txt']

globを使用してファイルのフルパスを取得する

ファイルの絶対パスが必要な場合:

from path import path
from glob import glob
x = [path(f).abspath() for f in glob("F:\\*.txt")]
for f in x:
    print(f)

>>> F:\acquistionline.txt
>>> F:\acquisti_2018.txt
>>> F:\bootstrap_jquery_ecc.txt

os.path.isfileを使用して、リスト内のディレクトリを回避します

import os.path
listOfFiles = [f for f in os.listdir() if os.path.isfile(f)]
print(listOfFiles)

>>> ['a simple game.py', 'data.txt', 'decorator.py']

Python 3.4のpathlibを使用する

import pathlib

flist = []
for p in pathlib.Path('.').iterdir():
    if p.is_file():
        print(p)
        flist.append(p)

 >>> error.PNG
 >>> exemaker.bat
 >>> guiprova.mp3
 >>> setup.py
 >>> speak_gui2.py
 >>> thumb.PNG

list comprehension

flist = [p for p in pathlib.Path('.').iterdir() if p.is_file()]

または、 pathlib.Path()代わりにpathlib.Path(".") pathlib.Path()使用します

pathlib.Path()でglobメソッドを使用します

import pathlib

py = pathlib.Path().glob("*.py")
for file in py:
    print(file)

>>> stack_overflow_list.py
>>> stack_overflow_list_tkinter.py

os.walkですべてのファイルのみを取得する

import os
x = [i[2] for i in os.walk('.')]
y=[]
for t in x:
    for f in t:
        y.append(f)
print(y)

>>> ['append_to_list.py', 'data.txt', 'data1.txt', 'data2.txt', 'data_180617', 'os_walk.py', 'READ2.py', 'read_data.py', 'somma_defaltdic.py', 'substitute_words.py', 'sum_data.py', 'data.txt', 'data1.txt', 'data_180617']

nextのファイルのみを取得し、ディレクトリ内を移動します

 import os
 x = next(os.walk('F://python'))[2]
 print(x)
 
 >>> ['calculator.bat','calculator.py']

nextのディレクトリのみを取得し、ディレクトリ内を移動します

 import os
 next(os.walk('F://python'))[1] # for the current dir use ('.')
 
 >>> ['python3','others']

walkすべてのサブディレクトリ名を取得します

for r,d,f in os.walk("F:\\_python"):
    for dirs in d:
        print(dirs)

>>> .vscode
>>> pyexcel
>>> pyschool.py
>>> subtitles
>>> _metaprogramming
>>> .ipynb_checkpoints

os.scandir()

import os
x = [f.name for f in os.scandir() if f.is_file()]
print(x)

>>> ['calculator.bat','calculator.py']

# Another example with scandir (a little variation from docs.python.org)
# This one is more efficient than os.listdir.
# In this case, it shows the files only in the current directory
# where the script is executed.

import os
with os.scandir() as i:
    for entry in i:
        if entry.is_file():
            print(entry.name)

>>> ebookmaker.py
>>> error.PNG
>>> exemaker.bat
>>> guiprova.mp3
>>> setup.py
>>> speakgui4.py
>>> speak_gui2.py
>>> speak_gui3.py
>>> thumb.PNG

例:

例 1:サブディレクトリにはいくつのファイルがありますか?

この例では、すべてのディレクトリとそのサブディレクトリに含まれているファイルの数を探します。

import os

def count(dir, counter=0):
    "returns number of files in dir and subdirs"
    for pack in os.walk(dir):
        for f in pack[2]:
            counter += 1
    return dir + " : " + str(counter) + "files"

print(count("F:\\python"))

>>> 'F:\\\python' : 12057 files'

例2:ディレクトリから別のディレクトリにすべてのファイルをコピーするにはどうすればよいですか?

あるタイプ(デフォルト:pptx)のすべてのファイルを検索し、それらを新しいフォルダーにコピーするためのスクリプト。

import os
import shutil
from path import path

destination = "F:\\file_copied"
# os.makedirs(destination)

def copyfile(dir, filetype='pptx', counter=0):
    "Searches for pptx (or other - pptx is the default) files and copies them"
    for pack in os.walk(dir):
        for f in pack[2]:
            if f.endswith(filetype):
                fullpath = pack[0] + "\\" + f
                print(fullpath)
                shutil.copy(fullpath, destination)
                counter += 1
    if counter > 0:
        print('-' * 30)
        print("\t==> Found in: `" + dir + "` : " + str(counter) + " files\n")

for dir in os.listdir():
    "searches for folders that starts with `_`"
    if dir[0] == '_':
        # copyfile(dir, filetype='pdf')
        copyfile(dir, filetype='txt')


>>> _compiti18\Compito Contabilità 1\conti.txt
>>> _compiti18\Compito Contabilità 1\modula4.txt
>>> _compiti18\Compito Contabilità 1\moduloa4.txt
>>> ------------------------
>>> ==> Found in: `_compiti18` : 3 files

例 3:txtファイル内のすべてのファイルを取得する方法

すべてのファイル名でtxtファイルを作成する場合:

import os
mylist = ""
with open("filelist.txt", "w", encoding="utf-8") as file:
    for eachfile in os.listdir():
        mylist += eachfile + "\n"
    file.write(mylist)

例:ハードドライブのすべてのファイルを含むtxt

"""
We are going to save a txt file with all the files in your directory.
We will use the function walk()
"""

import os

# see all the methods of os
# print(*dir(os), sep=", ")
listafile = []
percorso = []
with open("lista_file.txt", "w", encoding='utf-8') as testo:
    for root, dirs, files in os.walk("D:\\"):
        for file in files:
            listafile.append(file)
            percorso.append(root + "\\" + file)
            testo.write(file + "\n")
listafile.sort()
print("N. of files", len(listafile))
with open("lista_file_ordinata.txt", "w", encoding="utf-8") as testo_ordinato:
    for file in listafile:
        testo_ordinato.write(file + "\n")

with open("percorso.txt", "w", encoding="utf-8") as file_percorso:
    for file in percorso:
        file_percorso.write(file + "\n")

os.system("lista_file.txt")
os.system("lista_file_ordinata.txt")
os.system("percorso.txt")

1つのテキストファイル内のC:\のすべてのファイル

これは前のコードの短いバージョンです。 別の位置から開始する必要がある場合は、ファイルの検索を開始するフォルダーを変更します。 このコードは、完全なパスを持つファイルを含む500.000行未満のテキストファイルで50MBを生成します。

import os

with open("file.txt", "w", encoding="utf-8") as filewrite:
    for r, d, f in os.walk("C:\\"):
        for file in f:
            filewrite.write(f"{r + file}\n")

タイプのフォルダにすべてのパスを含むファイルを書き込む方法

この関数を使用すると、検索するファイルのタイプの名前(pngfile.txtなど)と、そのタイプのすべてのファイルのすべてのフルパスを含むtxtファイルを作成できます。 たまに役立つと思います。

import os

def searchfiles(extension='.ttf', folder='H:\\'):
    "Create a txt file with all the file of a type"
    with open(extension[1:] + "file.txt", "w", encoding="utf-8") as filewrite:
        for r, d, f in os.walk(folder):
            for file in f:
                if file.endswith(extension):
                    filewrite.write(f"{r + file}\n")

# looking for png file (fonts) in the hard disk H:\
searchfiles('.png', 'H:\\')

>>> H:\4bs_18\Dolphins5.png
>>> H:\4bs_18\Dolphins6.png
>>> H:\4bs_18\Dolphins7.png
>>> H:\5_18\marketing html\assets\imageslogo2.png
>>> H:\7z001.png
>>> H:\7z002.png

(新規)すべてのファイルを検索し、tkinterGUIで開きます

この2019年に、ディレクトリ内のすべてのファイルを検索し、リスト内のファイルの名前をダブルクリックしてそれらを開くことができる小さなアプリを追加したかっただけです。enter image description here

import tkinter as tk
import os

def searchfiles(extension='.txt', folder='H:\\'):
    "insert all files in the listbox"
    for r, d, f in os.walk(folder):
        for file in f:
            if file.endswith(extension):
                lb.insert(0, r + "\\" + file)

def open_file():
    os.startfile(lb.get(lb.curselection()[0]))

root = tk.Tk()
root.geometry("400x400")
bt = tk.Button(root, text="Search", command=lambda:searchfiles('.png', 'H:\\'))
bt.pack()
lb = tk.Listbox(root)
lb.pack(fill="both", expand=1)
lb.bind("<Double-Button>", lambda x: open_file())
root.mainloop()
sepp2k picture
2010年07月09日
863
import os
os.listdir("somedirectory")

「somedirectory」内のすべてのファイルとディレクトリのリストを返します。

Remi picture
2014年01月19日
165

ファイルのリストのみを取得

filenames = next(os.walk(path))[2]

または絶対パス名:

paths = [os.path.join(path, fn) for fn in next(os.walk(path))[2]]
Johnny picture
2013年10月11日
136

ディレクトリとそのすべてのサブディレクトリから完全なファイルパスを取得する

import os

def get_filepaths(directory):
    """
    This function will generate the file names in a directory 
    tree by walking the tree either top-down or bottom-up. For each 
    directory in the tree rooted at directory top (including top itself), 
    it yields a 3-tuple (dirpath, dirnames, filenames).
    """
    file_paths = []  # List which will store all of the full filepaths.

    # Walk the tree.
    for root, directories, files in os.walk(directory):
        for filename in files:
            # Join the two strings in order to form the full filepath.
            filepath = os.path.join(root, filename)
            file_paths.append(filepath)  # Add it to the list.

    return file_paths  # Self-explanatory.

# Run the above function and store its results in a variable.   
full_file_paths = get_filepaths("/Users/johnny/Desktop/TEST")

  • 上記の関数で指定したパスには、3つのファイルが含まれていました。2つはルートディレクトリにあり、もう1つは「SUBFOLDER」というサブフォルダーにあります。 これで、次のようなことができます。
  • リストを出力するprint full_file_paths

    • ['/Users/johnny/Desktop/TEST/file1.txt', '/Users/johnny/Desktop/TEST/file2.txt', '/Users/johnny/Desktop/TEST/SUBFOLDER/file3.dat']

必要に応じて、コンテンツを開いて読み取るか、以下のコードのように拡張子が「.dat」のファイルのみに焦点を当てることができます。

for f in full_file_paths:
  if f.endswith(".dat"):
    print f

/Users/johnny/Desktop/TEST/SUBFOLDER/file3.dat

SzieberthAdam picture
2015年06月19日
81

バージョン3.4以降、 os.listdir()よりもはるかに効率的なこのための組み込みイテレータがあり

pathlibバージョン3.4の新機能。

>>> import pathlib
>>> [p for p in pathlib.Path('.').iterdir() if p.is_file()]

PEP 428によると、 pathlibライブラリの目的は、ファイルシステムパスとユーザーがそれらに対して行う一般的な操作を処理するためのクラスの単純な階層を提供することです。

os.scandir()バージョン3.5の新機能。

>>> import os
>>> [entry for entry in os.scandir('.') if entry.is_file()]

os.walk()はバージョン3.5のos.listdir()ではなくos.scandir()使用し、 PEP 471によるとその速度は2〜20倍になっていることに注意してください。

以下のShadowRangerのコメントも読むことをお勧めします。

CristiFati picture
2018年01月23日
57

予備メモ

  • 質問テキストではファイルディレクトリの用語が明確に区別されていますが、ディレクトリは実際には特別なファイルであると主張する人もいます。
  • ディレクトリのすべてのファイル」というステートメントは、次の2つの方法で解釈できます。
    1. すべての直接(またはレベル1)の子孫のみ
    2. ディレクトリツリー全体のすべての子孫(サブディレクトリの子孫を含む)
  • 質問されたとき、 Python 2LTSバージョンだったと思いますが、コードサンプルはPython 3.5で実行されます(可能な限りPython 2に準拠したままにします。また、に属するコードはすべて私が投稿するPythonは、特に指定がない限り、 v3.5.4以降のものです)。 それは質問の別のキーワードに関連する結果をもたらします:「それらをリストに追加する

ArtOfWarfare picture
2014年07月09日
48

同じ名前のモジュールからglob()を使用することを提案する、 adamkの答えが本当に気に入り*とパターンマッチングを行うことができます。

しかし、他の人がコメントで指摘しているように、 glob()は一貫性のないスラッシュの方向につまずく可能性があります。 それを支援するために、私はあなたが使用することをお勧めjoin()expanduser()の関数os.pathモジュール、そしておそらくgetcwd()で機能osモジュールも。

例として:

from glob import glob

# Return everything under C:\Users\admin that contains a folder called wlp.
glob('C:\Users\admin\*\wlp')

上記はひどいです-パスはハードコードされており、Windows上でドライブ名とパスにハードコードされている\の間でのみ機能します。

from glob    import glob
from os.path import join

# Return everything under Users, admin, that contains a folder called wlp.
glob(join('Users', 'admin', '*', 'wlp'))

上記の方がうまく機能しますが、フォルダ名Usersに依存しています。これは、Windowsでよく見られ、他のOSではあまり見られません。 また、特定の名前adminを持つユーザーに依存します。

from glob    import glob
from os.path import expanduser, join

# Return everything under the user directory that contains a folder called wlp.
glob(join(expanduser('~'), '*', 'wlp'))

これは、すべてのプラットフォームで完全に機能します。

プラットフォーム間で完全に機能し、少し異なることを行うもう1つの優れた例:

from glob    import glob
from os      import getcwd
from os.path import join

# Return everything under the current directory that contains a folder called wlp.
glob(join(getcwd(), '*', 'wlp'))

これらの例が、標準のPythonライブラリモジュールにあるいくつかの関数の能力を理解するのに役立つことを願っています。

Apogentus picture
2014年06月11日
37
def list_files(path):
    # returns a list of names (with extension, without full path) of all files 
    # in folder path
    files = []
    for name in os.listdir(path):
        if os.path.isfile(os.path.join(path, name)):
            files.append(name)
    return files